robotu-molkit 分子工具包

robotu-molkit

嵌入式 ⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
Robotu-ai 1 Stars Apache-2.0 BOM 完整度: /5 教程完整度: /5

项目简介

开源Python库,从PubChem提取记录并结构化分子。


量子就绪分子工具包。开源Python库,可拉取PubChem记录,将其结构化为具有丰富属性集的Molecule对象,并通过IBM Granite摘要和嵌入进行增强——适用于量子模拟、AI流水线和科学研究。

项目特点

**AI 原生分子增强**:利用 IBM Granite 模型为每个分子生成人类可读的摘要和高维向量嵌入,实现语义搜索。
**PubChem 数据集成**:直接从 PubChem 获取并标准化分子记录,覆盖超过 10 个属性类别。
**语义与结构混合搜索**:支持基于 Tanimoto 系数的结构相似性搜索和基于 AI 向量的语义搜索,并可通过元数据过滤。
**量子就绪设计**:输出模拟就绪的 `Molecule` 对象,为量子计算工作流做好准备。
**命令行界面 (CLI)**:提供 `molkit` 命令行工具,方便执行配置、数据摄取和嵌入生成等操作。
**本地 FAISS 支持**:使用本地 FAISS 进行高效的向量相似性搜索。

技术规格

编程语言
核心依赖
输入数据源
输出格式
主要功能
许可证

项目资源

物料清单 (BOM)

物料名称 数量 参考价格 备注
Python 环境 1 必需
IBM watsonx API 密钥 1 必需,用于 AI 功能
PubChem CID 列表 1 用户提供

所需工具

工具用途是否必需
Python 3.8+ 运行库和脚本 ✅ 是
pip 安装 robotu-molkit 及其依赖 ✅ 是
文本编辑器或 IDE 编写和运行 Python 代码 ✅ 是
IBM watsonx 账户 获取 API 密钥和项目 ID ✅ 是

能力画像

记忆与知识检索
逻辑推演
表达与交流
感知与观察
数理与计算
动手与操作
狂热与坚持
创造与创新

所需技能

💻 **编程能力**:需要具备 Python 编程基础,能够使用 pip 安装包、编写脚本并调用 API。 ⚡ **电子电路**:不适用。 🔧 **动手能力**:不适用。

适用场景

**药物发现研究**:快速筛选和搜索具有特定药理特性的分子。
**量子化学计算**:为量子计算模拟准备标准化的分子数据。
**AI 加速科学**:利用 AI 模型对化学数据进行语义理解和增强。
**化学信息学教学**:作为教学工具,演示如何结合 AI 和化学数据库进行分子分析。