Parece que foi apenas alguns anos atrás que o termo “Big Data” passou de uma área promissora de pesquisa e interesse para algo tão onipresente que perdeu todo o significado, descendo em última análise na ponta das piadas.
Felizmente, o ruído associado a “Big Data” está diminuindo à medida que sofisticação e senso comum se apoderam. Na verdade, em muitos círculos, o termo realmente expõe o usuário como alguém que realmente não entende o espaço. Infelizmente, a mesma doença já afligiu a inteligência artificial (AI). Todo mundo que conheço está fazendo uma “jogada AI”.
AI é, infelizmente, o novo “Big Data”. Embora não seja bom, também não é ruim, afinal, o ecossistema de dados beneficiou de toda a atenção e investimento do Big Data”, criando softwares incríveis e produzindo ganhos de produtividade excepcionais.
O mesmo acontecerá com a AI – com o aumento da atenção, os dólares de investimento, que, por sua vez, direcionarão a adoção – aumentando o ecossistema.
Mas a questão deve ser levantada – o que se qualifica como AI?
Em primeiro lugar, a definição atual da IA está focada na IA de uso estreito e específico do aplicativo, e não no problema mais geral da inteligência geral artificial (AGI), onde a simulação de uma pessoa que usa o software é equivalente à inteligência.
Em segundo lugar, a grande e vasta maioria dos dados que existem no mundo não está marcada. Não é prático rotular esses dados manualmente e, assim, provavelmente criaria uma polarização de qualquer maneira. Dados não-rotulados apresentam um desafio diferente, mas o ponto chave aqui é que está em toda parte e representa a chave para extrair o valor do negócio ou qualquer valor.
Em terceiro lugar, não estamos produzindo cientistas de dados a uma taxa que possa acompanhar o crescimento dos dados. Mesmo com o moniker como o “trabalho mais sexy do século 21”, o ritmo no qual os cientistas de dados são criados não começa a abordar a taxa de crescimento que estamos vendo nos dados.
Em quarto lugar, os cientistas de dados, em sua maioria, não são designers ou gerentes de produtos UX ou, em muitos casos, até engenheiros. Como resultado, os especialistas em assuntos – aqueles que se sentem no negócio – não possuem interfaces efetivas para os resultados da ciência dos dados. As interfaces que possuem – relatórios do PowerPoint, Excel ou PDF – têm utilidade limitada para transformar o comportamento de uma empresa. O que é necessário é algo para moldar o comportamento e as aplicações.
Então, o que se qualifica como inteligência? Aqui está uma tomada para o que AI deve exibir, e engloba uma estrutura. Enquanto alguns desses elementos podem parecer auto-evidentes, isso é porque eles são considerados como um único item. A inteligência tem um contexto mais amplo. Todos os elementos devem funcionar em conjunto uns com os outros para se qualificarem como AI.
1 – Descobrir
A descoberta é a capacidade de um sistema inteligente para aprender com os dados sem intervenção humana antecipada. Muitas vezes, isso precisa ser feito sem ser apresentado com um objetivo explícito. Baseia-se no uso de técnicas de aprendizagem mecânica sem supervisão e semi-supervisionadas (como segmentação, redução de dimensionalidade, detecção de anomalia e mais), bem como técnicas mais supervisionadas, onde há um resultado ou há vários resultados de interesse.
Normalmente, no software corporativo, o termo descoberta refere-se à capacidade das soluções ETL / MDM para descobrir os vários esquemas de tabelas em grandes bancos de dados e encontrar automaticamente, juntar chaves etc. Isso não é o que queremos dizer com a descoberta. Usamos o termo de forma muito diferente e tem implicações importantes.
Em conjuntos de dados complexos, é quase impossível fazer as perguntas “certas”. Para descobrir qual é o valor dentro dos dados, é preciso entender todos os relacionamentos que são inerentes e importantes nos dados. Isso exige uma abordagem baseada em princípios para a geração de hipóteses.
Uma técnica, a análise de dados topológicos (TDA), é excepcional em relacionamentos escondidos emergentes que existem nos dados e identificam as relações que são significativas sem ter que fazer perguntas específicas sobre os dados. O resultado é uma saída que é capaz de representar fenômenos complexos e, portanto, é capaz de detectar sinais mais fracos, bem como os sinais mais fortes.
Isso permite a detecção de fenômenos emergentes. Como resultado, as empresas agora podem descobrir respostas a perguntas que nem sequer sabem perguntar e fazê-lo com dados que não estão marcados.
2 – Prever
Uma vez que o conjunto de dados é entendido através de descoberta inteligente, abordagens supervisionadas são aplicadas para prever o que acontecerá no futuro. Estes tipos de problemas incluem classificação, regressão e classificação.
Para este pilar, a maioria das empresas usa um conjunto padrão de algoritmos supervisionados de aprendizagem de máquinas, incluindo florestas aleatórias, gradientes de aumento, aprendentes lineares / escassos. Note-se, no entanto, que o trabalho não supervisionado do passo anterior é altamente útil de muitas maneiras. Por exemplo, ele pode gerar recursos relevantes para uso em tarefas de previsão ou encontrar manchas locais de dados onde os algoritmos supervisionados podem lutar (erros sistemáticos).
A fase de previsão é uma parte importante do valor comercial associado à ciência dos dados; no entanto, em geral, na análise preditiva, existe uma noção de que esta é a soma total da aprendizagem de máquinas. Este não é o caso de longe.
A predição, embora importante, é bastante bem compreendida e não, por si só qualifica-se como “inteligência”. Além disso, a previsão pode dar errado ao longo de várias dimensões, particularmente se os grupos em que você está preditor forem atacados com algum tipo de viés . Por si só, a previsão não é AI, e precisamos parar de chamá-lo como tal.
3 – Justificar
As aplicações precisam apoiar a interação com os seres humanos de uma forma que torne os resultados reconhecíveis e credíveis. Por exemplo, quando se constrói um modelo preditivo, é importante ter uma explicação de como o modelo está fazendo o que está fazendo, como o que os recursos do modelo estão fazendo em termos que são familiares aos usuários do modelo. Esse nível de familiaridade é importante para gerar confiança e intuição.
Da mesma forma, da mesma forma que os automóveis têm mecanismos não apenas para detectar a presença de um mau funcionamento, mas também para especificar a natureza do mau funcionamento e sugerindo um método para corrigi-lo, então é preciso ter uma compreensão de nozes e parafusos como um aplicativo está funcionando para “consertá-lo” quando erra.
Há uma diferença entre transparência e justificativa. A transparência diz-lhe quais algoritmos e parâmetros foram utilizados, enquanto a justificativa diz o motivo. Para que a inteligência seja significativa, deve ser capaz de justificar e explicar suas afirmações, bem como para poder diagnosticar falhas. Nenhum líder deve implantar aplicações inteligentes e autônomas contra problemas críticos de negócios sem uma compreensão completa das variáveis que impulsionam o modelo. As empresas não podem se mover para um modelo de aplicativos inteligentes sem confiança e transparência.
4 – Agir
AI sem UX é de utilidade limitada. UX é o que distribui essa inteligência em toda a organização e empurra-a para a borda – onde pode ser consumido por profissionais e especialistas em assuntos.
Em última análise, o processo de operacionalização de uma aplicação inteligente dentro da empresa requer algumas mudanças na organização, aceitação de que o aplicativo evoluirá ao longo do tempo e que irá exigir mudanças a jusante – automatizado ou de outra forma.
Para que isso aconteça, as aplicações inteligentes precisam ser “ao vivo” no processo de negócios, vendo novos dados e executando automaticamente o ciclo de descobrir, prever, justificar uma freqüência que faz sentido para esse processo comercial. Para alguns processos, que podem ser trimestrais, para outros, diariamente. Esse loop pode até ser medido em segundos.
5 – Aprender
Os sistemas inteligentes são projetados para detectar e reagir à medida que os dados evoluem. Um sistema inteligente é aquele que está sempre aprendendo, vive no fluxo de trabalho e está melhorando constantemente. No mundo dos dados modernos, uma aplicação que não está ficando mais inteligente é ficar mais burda.
As aplicações inteligentes são projetadas para detectar e reagir quando as distribuições de dados evoluem. Como resultado, eles precisam estar “no fio” para detectar esses fenômenos antes que eles se tornem um problema.
Muitas soluções fornecem uma resposta em um ponto do tempo; Um sistema inteligente é aquele que está sempre aprendendo através do quadro descrito aqui. Isso é o que define a inteligência – e não um algoritmo de aprendizado de máquinas que chama PDFs contendo previsões ou os resultados do trabalho de um cientista de dados. Para que a indústria continue a crescer e a evoluir, precisamos começar a fazer um melhor trabalho ao reconhecer o que é verdadeiramente AI e o que não é.
Gurjeet Singh é PhD e diretor executivo da Ayasdi.
Fonte: HealthData Management