Storage and retrievalEdit
a primary application of cheminformatics is the storage, indexing, and search of information relating to chemical compounds. A busca eficiente de tais informações armazenadas inclui tópicos que são tratados em Ciência da computação, tais como mineração de dados, recuperação de informação, extração de informação e aprendizagem de máquinas. Os tópicos de investigação relacionados incluem:
File formatsEdit
a representação in sílica de estruturas químicas utiliza formatos especializados, tais como as especificações simplificadas de entrada molecular na linha de entrada (SMILES) ou a linguagem de marcação química baseada em XML. Estas representações são frequentemente usadas para armazenamento em grandes bancos de dados químicos. Enquanto alguns formatos são adequados para representações visuais em duas ou três dimensões, outros são mais adequados para estudar interações físicas, modelagem e estudos de acoplagem.
virtual librariesEdit
Chemical data can pertain to real or virtual molecules. Bibliotecas virtuais de compostos podem ser geradas de várias maneiras para explorar o espaço químico e colocar a hipótese de novos compostos com propriedades desejadas. Bibliotecas virtuais de classes de compostos (drogas, produtos naturais, produtos sintéticos orientados à diversidade) foram recentemente geradas usando o algoritmo FOG (fragment optimized growth). Isto foi feito usando ferramentas quimiinformáticas para treinar probabilidades de transição de uma cadeia de Markov em classes autênticas de compostos, e, em seguida, usando a cadeia de Markov para gerar compostos novos que eram semelhantes à base de dados de treinamento.
virtual screeningEdit
Quantitative structure-activity relationship (QSAR)Edit
This is the calculation of quantitative structure–activity relationship and quantitative structure property relation values, used to predict the activity of compounds from their structures. Neste contexto, existe também uma forte relação com a quimiometria. Os sistemas de peritos químicos também são relevantes, uma vez que representam partes do conhecimento químico como uma representação in silico. Há um conceito relativamente novo de análise de pares moleculares emparelhados ou MMPA orientado por predição que é acoplado com o modelo QSAR, a fim de identificar cliff de atividade.