- nlogP帖子(已经自己跑过了)预测化学分子的nlogP——基于sklearn, deepchem, DGL, Rdkit的图卷积网络模型_rdkit 图卷积-CSDN博客
- 上面跑的时候结合和llq的代码(即他基于deepchem库进行模型构建)+ gpt生成的不是很行的deepchem代码
- DGL帖子(基本自己跑过了)图卷积神经网络(GCNN)预测分子药物致突变性:DGL&DGL-life - 知乎 (zhihu.com)
- Attentive FP帖子(没自己跑)DGL & RDKit | 基于Attentive FP的分子性质线性模型-腾讯云开发者社区-腾讯云 (tencent.com)
- DGLlife DGL-LifeSci:面向化学和生物领域的 GNN 算法库 - 码农教程 (manongjc.com)
- DGLlife DGL-LifeSci:面向化学和生物领域的 GNN 算法库-腾讯云开发者社区-腾讯云 (tencent.com) (这个和上面那个帖子基本是一样的)
- 之前看cyt文章找的一个deepchem帖子(完全没看)DeepChem-使用图卷积神经网络对化学分子建模_deepchem图网络-CSDN博客
目前(2023.11.18):
1.对第一个nlogP帖子学习的程度好些 对于deepchem这个库结合这个帖子、llq代码、gpt生成的错误代码有一定认识
2.结合nlogP和DGL帖子 对DGL库稍微有点认识(而且deepchem和dgl这两个库都只知道构建gcn模型 其他图模型都不知道)
3.通过11.8-11.14期间对PyG库的学习(虽然也还是只用这个库构建gcn 但感觉对构建图有了理解)
4.于是整体来说:就是首先 将自己的数据转换为对应库的图对象 就是图列表,然后 进行模型构建:定义模型的类 前向反向传播
具体说明:
PyG => 将smiles变成得到所需的dataset(即PyG的图Data对象的整合列表),再整合为一个大图,在大图基础上考虑划分
DGL => DGL帖子利用dgllife创建图train_g和train_y这样的列表 | 而nlogP帖子利用rdkit和dgl,由邻接矩阵,然后dgl.from_scipy(...) 得到图列表X
Deepchem => 利用dc.data.CSVLoader得到加载器,之后将df_train传入loader,得到train_set图列表
目前缺少:利用smiles、类别构建一个二分类模型,并且使用PyG、Deepchem、dgl等这些库来实现,能成功跑出结果
欠缺理解:构建图对象,模型这些应该如何更好的理解;GCN输入到底是什么?(原子特征数?) 又是经过怎么样的变换得到我们所需的输出维度;同样的问题对于deepchem等库构建图后用于模型如何理解?