robotu-molkit 分子工具包
robotu-molkit
嵌入式
⭐⭐⭐☆☆ (3/5)
🧩 软硬件结合
已发布
项目简介
开源Python库,从PubChem提取记录并结构化分子。
量子就绪分子工具包。开源Python库,可拉取PubChem记录,将其结构化为具有丰富属性集的Molecule对象,并通过IBM Granite摘要和嵌入进行增强——适用于量子模拟、AI流水线和科学研究。
项目特点
**AI 原生分子增强**:利用 IBM Granite 模型为每个分子生成人类可读的摘要和高维向量嵌入,实现语义搜索。
**PubChem 数据集成**:直接从 PubChem 获取并标准化分子记录,覆盖超过 10 个属性类别。
**语义与结构混合搜索**:支持基于 Tanimoto 系数的结构相似性搜索和基于 AI 向量的语义搜索,并可通过元数据过滤。
**量子就绪设计**:输出模拟就绪的 `Molecule` 对象,为量子计算工作流做好准备。
**命令行界面 (CLI)**:提供 `molkit` 命令行工具,方便执行配置、数据摄取和嵌入生成等操作。
**本地 FAISS 支持**:使用本地 FAISS 进行高效的向量相似性搜索。
技术规格
| 编程语言 | |
|---|---|
| 核心依赖 | |
| 输入数据源 | |
| 输出格式 | |
| 主要功能 | |
| 许可证 |
项目资源
物料清单 (BOM)
| 物料名称 | 数量 | 参考价格 | 备注 |
|---|---|---|---|
| Python 环境 | 1 | — | 必需 |
| IBM watsonx API 密钥 | 1 | — | 必需,用于 AI 功能 |
| PubChem CID 列表 | 1 | — | 用户提供 |
所需工具
| 工具 | 用途 | 是否必需 |
|---|---|---|
| Python 3.8+ | 运行库和脚本 | ✅ 是 |
| pip | 安装 robotu-molkit 及其依赖 | ✅ 是 |
| 文本编辑器或 IDE | 编写和运行 Python 代码 | ✅ 是 |
| IBM watsonx 账户 | 获取 API 密钥和项目 ID | ✅ 是 |
能力画像
记忆与知识检索
逻辑推演
表达与交流
感知与观察
数理与计算
动手与操作
狂热与坚持
创造与创新
项目图库
所需技能
💻 **编程能力**:需要具备 Python 编程基础,能够使用 pip 安装包、编写脚本并调用 API。
⚡ **电子电路**:不适用。
🔧 **动手能力**:不适用。
适用场景
**药物发现研究**:快速筛选和搜索具有特定药理特性的分子。
**量子化学计算**:为量子计算模拟准备标准化的分子数据。
**AI 加速科学**:利用 AI 模型对化学数据进行语义理解和增强。
**化学信息学教学**:作为教学工具,演示如何结合 AI 和化学数据库进行分子分析。