Num desafio bi-anual participado por cerca de 100 grupos de investigação, a Google, mais especificamente o projecto AlphaFold, resolveu uma complexa questão da biologia há muito por resolver, o Protein Structure Prediction. AlphaFold é o nome do programa desenvolvido pela Google, através da sua subsidiária Deepmind, para pôr os seus algoritmos e capacidade computacional a tentar resolver complexas questões da biologia envolvendo proteínas, treinados a partir de cerca de 170 mil exemplos de sequências e estruturas de proteínas disponíveis em repositórios públicos.
Foi num artigo publicado na revista Nature que chegou ao conhecimento público o feito alcançado pelo sistema de inteligência artificial operado pela Google. John Moult, criador do programa Critical Assessment of Structure Prediction (CASP) que desde 1994 promove a utilização de tecnologia computacional para a resolução desta operação, foi peremptório no anúncio dizendo que este avanço é muito significativo. Mas afinal o que é o CASP?
No discurso de aceitação do Nobel da Química, em 1972, Christian Anfisen afirmou que, em teoria, a estrutura de aminoácidos de uma proteína devia determinar a sua estrutura. Sucintamente, o químico afirmava que conhecida a sequência unidimensional de aminoácidos seria possível determinar a estrutura tridimensional da proteína, fintando outras técnicas e métodos de chegar a este resultado. Durante mais de 50 anos esta hipótese permaneceu no campo da teoria, mas os resultados agora obtidos pela IA podem significar um novo capítulo nesta exploração.
O CASP, programa de incentivo, decorre de forma bi-anual desafiando várias equipas de investigadores a resolver este complexo problema por se acreditar no seu potencial para desbloquear outros avanços científicos de modo exponencial. Já em 2018, na sua primeira participação, a equipa da DeepMind tinha revelado uma boa performance, mas os resultados apresentados agora, em 2020, parecem ser ainda mais promissores no que toca à aplicabilidade prática da descoberta. Estima-se que a confirmação desta hipótese, e o desenvolvimento de sistemas computacionais que a permitam pôr em prática, pode representar avanços significativos nomeadamente na medicina e bioengenharia.
Ao determinar computacionalmente a estrutura tridimensional de uma proteína dando apenas informação sobre os aminoácidos, o sistema permitirá poupar tempo e recursos em ambiente laboratorial, permitindo aos investigadores com acesso a esta ferramenta queimar etapas de um processo habitualmente moroso.
Segundo o artigo da revista Nature, onde se conhece um pouco mais sobre a forma como esta descoberta foi atingida, este breaktrough que nas notícias é commumente rotulado como “um feito da IA” pode, tecnicamente, ter uma outra base. Se em 2018 o AlphaFold aplicava o conhecido método de inteligência artificial deep learning, desta vez, John Jumper, coordenador do projecto da DeepMind, revelou que foi utilizado um modelo de “consenso” para prever a estrutura das proteína, e que foi posteriormente acoplado a um sistema de inteligência artificial que adicionava à equação as restrições físicas e geométricas que determinam as “dobras” de uma proteína. Com tudo junto (consenso mais restrições determinadas pela IA), o algoritmo da AlphaFold revelou uma capacidade de previsão da estrutura proteíca com cerca de 90% de acerto.
Para se ter uma ideia da aplicabilidade prática desta descoberta, com este sistema de predição da estrutura de uma proteína é possível que laboratórios de investigação percebam o formato tridimensional das proteínas com diferentes origens com que trabalham, permitindo mais facilmente o desenvolvimento de novas terapêuticas, por exemplo. Andrei Lupas, biológo no Max Planck Institute for Developmental Biology em Tübingen, na Alemanha, revelou que o Grupo 427 (como ficou conhecida a resposta da AlphaFold ainda em anónimo) foi capaz de determinar a estrutura de uma proteína de origem bacterial em apenas 30 minutos, ao passo que a sua equipa de investigação estava há décadas a tentar chegar a este resultado.
Se por um lado estes avanços tecnológicos com aplicação na medicina são sempre motivo de celebração para a humanidade porque permitirão a criação mais eficaz de terapêuticas e fármacos para problemas conhecidos, a verdade é que não podemos desprezar as questões éticas que lhes surgem associadas. É o que nos lembra Aral Balkan, o programador e crítico de tecnologia que, em jeito de piada, lança a reflexão sobre como estes avanços nas mãos de uma empresa monopolista podem desacelerar a sua regulação noutros sectores. A assimetria de poder, ao nível da capacidade de desenvolvimento e investigação, com a Google a dominar em mais um sector dá ainda mais argumentos à empresa nas importantes questões políticas com que se vai debatendo – dentro e fora dos Estados Unidos da América.
This is monumental for two reasons:
1. It’s a momentous scientific breakthrough.
2. Good luck regulating Google – a trillion-dollar surveillance capitalist – in the future.https://t.co/NRuJUNjCuI
— Aral Balkan, a screeching voice of the minority (@aral) December 1, 2020