Skip to content

Latest commit

 

History

History
714 lines (546 loc) · 31.4 KB

File metadata and controls

714 lines (546 loc) · 31.4 KB
OmicsClaw Logo

🧬 OmicsClaw

面向多组学分析的持久化 AI 研究助手

记住数据 • 保留偏好 • 延续工作流

对话式交互 · 记忆增强 · 本地优先 · 跨平台

English简体中文

OmicsClaw

一个带记忆的 AI 科研助手。 OmicsClaw 把多组学分析从一次性的命令执行,变成可以持续推进的对话式工作流。它能够记录数据集、分析上下文和用户偏好,并在后续会话中继续推进分析。

Python 3.11+ License Code style: black CI Website

Note

🚀 v0.1.0 正式发布

OmicsClaw v0.1.0 已正式发布。当前版本完成了核心交互与执行框架,提供原生记忆管理面板 Memory Explorer,并内置覆盖 8 个领域的 72 个分析技能。欢迎通过 GitHub Issues 提交问题和建议。

⚡ 一套内核,多种交互界面

🖥️ CLI / TUI

📱 移动端(飞书)

OmicsClaw_CLI.mp4
Feishu_bot.MP4

为什么选择 OmicsClaw?

很多分析工具的默认前提是“每次都从头开始”。换一次会话,就要重新说明数据、重新设置参数、重新回忆上一步做到了哪里。OmicsClaw 的重点是把这些上下文保存下来,让分析工作具备连续性。

✨ 主要特性

  • 🧠 持久记忆:会话上下文、分析历史和用户偏好可以跨会话保留。
  • 🛠️ 可扩展性:原生支持 MCP,内置 omics-skill-builder 用于生成自定义技能脚手架。
  • 🌐 多模型后端:支持 Anthropic、OpenAI、DeepSeek、本地模型等多种 LLM 提供方。
  • 📱 多通道接入:CLI 是核心入口,同时可接入 Telegram、飞书等通讯平台,共享同一套会话和记忆。
  • 🔄 工作流连续性:可以恢复中断任务、追踪分析血缘,减少重复计算。
  • 🔒 本地优先:计算在本地完成,记忆系统仅保存元数据,不上传原始数据。
  • 🎯 智能路由:自然语言请求可自动映射到合适的分析技能。
  • 🧬 多组学覆盖:内置 72 个技能,覆盖空间转录组、单细胞、基因组、蛋白组、代谢组、Bulk RNA-seq、文献挖掘和编排调度。

与传统工具的差异:

传统工具 OmicsClaw
每次会话都要重新指定数据路径 自动记住数据路径和元信息
分析历史难以回溯 追踪完整血缘关系(预处理 → 聚类 → 差异分析)
参数需要反复手动输入 可记住并复用偏好设置
只有命令行入口,学习成本较高 同时支持自然语言交互和 CLI
一次性、无状态执行 支持跨会话持续协作

📖 进一步了解: 参见 docs/MEMORY_SYSTEM.md,查看带记忆工作流与无状态工具的详细对比。

📦 安装

为减少依赖冲突,建议在虚拟环境中安装。可使用标准 venv,也可以使用 uv

🪛 创建虚拟环境(推荐)

方案 A:使用 venv

# 1. 创建虚拟环境
python3 -m venv .venv

# 2. 激活虚拟环境
source .venv/bin/activate

方案 B:使用 uv

# 1. 安装 uv(如果尚未安装)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 创建并激活虚拟环境
uv venv
source .venv/bin/activate
# 克隆仓库
git clone https://github.com/TianGzlab/OmicsClaw.git
cd OmicsClaw

# 安装核心功能
pip install -e .

# 可选:安装 TUI 和 Bot 能力
pip install -e ".[tui]"
pip install -r bot/requirements.txt

分层安装:

  • pip install -e .:仅安装核心系统
  • pip install -e ".[<domain>]":按领域安装,如 spatialsinglecellgenomicsproteomicsmetabolomicsbulkrna
  • pip install -e ".[spatial-domains]":安装 SpaGCN / STAGATE 相关深度学习依赖
  • pip install -e ".[full]":安装所有领域依赖和可选方法后端

可随时运行 python omicsclaw.py env 检查安装状态。

🔑 配置

最简单的方式:使用交互式向导

OmicsClaw 内置了配置向导,可以依次设置 LLM、共享运行时参数、记忆系统和消息通道凭证。

omicsclaw onboard  # 或使用短命令: oc onboard

向导会把结果写入项目根目录下的 .env 文件。

OmicsClaw 配置向导
手动配置(.env)

OmicsClaw 会统一读取项目根目录下的 .env 文件,CLI、TUI、路由层和 Bot 入口使用同一套配置。若未安装 python-dotenv,系统会退回到内置解析器,因此标准的 KEY=value 语法同样可用。

对于云端模型服务,可以使用以下任一种方式:

  • 统一使用 LLM_API_KEY
  • 使用服务商专属变量,如 DEEPSEEK_API_KEYOPENAI_API_KEYANTHROPIC_API_KEY

1. DeepSeek(默认)

DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

2. Anthropic(Claude)

ANTHROPIC_API_KEY=sk-ant-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
# 系统会自动识别并使用默认模型

3. OpenAI(GPT-4o 等)

OPENAI_API_KEY=sk-proj-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

4. 本地模型(Ollama)

LLM_PROVIDER=ollama
OMICSCLAW_MODEL=qwen2.5:7b
LLM_BASE_URL=http://localhost:11434/v1

5. 自定义兼容 OpenAI 协议的接口

LLM_PROVIDER=custom
LLM_BASE_URL=https://your-endpoint.example.com/v1
OMICSCLAW_MODEL=your-model-name
LLM_API_KEY=sk-xxxxxxxxxxxxxxxx

📖 完整服务商列表: 参见 .env.example

📖 Bot / 通道配置: 参见 bot/README.mdbot/CHANNELS_SETUP.md

⚡ 快速开始

1. 交互式聊天界面

# 启动交互式终端
omicsclaw interactive  # 或: oc interactive
omicsclaw tui          # 或: oc tui

# 或启动消息通道作为前端
python -m bot.run --channels feishu,telegram

📖 Bot 配置说明: 参见 bot/README.md

示例:

用户: "对我的 Visium 数据做预处理"
Bot: ✅ [执行 QC、归一化、聚类]
     💾 [记录: visium_sample.h5ad, 5000 spots, normalized]

[第二天]
用户: "继续做空间结构域识别"
Bot: 🧠 "已找到你昨天处理过的 Visium 数据(5000 spots,已归一化)。
     现在开始进行结构域识别。"
交互模式下的常用命令(CLI / TUI)
命令 说明
分析与调度
/run <skill> [...] 直接运行分析技能,例如 /run spatial-domains --demo
/skills [domain] 列出可用技能
/research 启动多智能体研究流程
/install-skill 从本地或 GitHub 安装扩展技能
工作流与计划
/plan 查看或创建当前会话计划
/tasks 查看当前流程的结构化任务列表
/approve-plan 批准计划继续执行
/do-current-task 继续执行当前任务
会话与记忆
/sessions 查看最近会话
/resume [id/tag] 恢复之前的会话
/new / /clear 新建或清空当前会话
/memory 管理语义记忆与实体追踪
/export 导出当前会话结果为 Markdown 报告
系统与设置
/mcp 管理 MCP 服务器(/mcp list/add/remove
/config 查看或更新模型与引擎配置
/doctor / /usage 诊断环境或查看 token 使用量
/exit 退出 OmicsClaw
Bot 模式下的常用命令(Telegram / 飞书)
命令 说明
/start / /help 查看欢迎信息和帮助
/skills 浏览技能列表
/demo <skill> 运行技能示例
/new / /clear 开启新分支或清空当前对话
/forget 清空记忆和会话状态
/files / /outputs 查看上传的数据或近期输出
/recent 查看最近 3 次分析记录
/status / /health 查看运行状态与健康信息

2. 命令行方式

# 运行 demo(无需自备数据)
python omicsclaw.py run spatial-preprocess --demo

# 使用自己的数据
python omicsclaw.py run spatial-preprocess --input data.h5ad --output results/

📚 文档入口: INSTALLATION.mdMETHODS.mdMEMORY_SYSTEM.md

Memory System:核心能力之一

OmicsClaw 的记忆系统让它不只是一个“收到命令就执行”的工具,而是能够持续保留研究上下文。配套的 Memory Explorer 提供了一个前端界面,用于查看分析历史、数据血缘和用户偏好。

Memory System Explorer Frontend Interface
Memory Explorer:用于查看分析历史、数据关系和用户偏好的统一面板。

启动方式:

# 终端 1:启动后端 API
oc memory-server

# 终端 2:启动前端面板
cd frontend && npm install && npm run dev

默认情况下,Memory API 监听在 127.0.0.1:8766。如果需要暴露到本机之外,请同时配置 OMICSCLAW_MEMORY_HOSTOMICSCLAW_MEMORY_API_TOKEN

桌面 / Web 前端后端:

pip install -e ".[desktop]"
oc app-server --host 127.0.0.1 --port 8765

该后端默认监听 127.0.0.1:8765,提供 OmicsClaw-App 所使用的 HTTP / SSE 接口。desktop extra 现在也会安装 notebook 运行时依赖,因此同一个 oc app-server 进程会直接暴露嵌入式 notebook 所需的原生 /notebook/* 路由。

如果环境里已经安装 omicsclaw_kg,或者通过 OMICSCLAW_KG_SOURCE_DIR=/path/to/OmicsClaw-KG 提供源码目录,那么同一个 oc app-server 进程也会挂载 KG Explorer 所需的 /kg/* 路由。前端开发服务器现在默认把 /kg 代理到 app-server,不再默认依赖单独的 omicsclaw-kg http serve 进程。

系统会记录的内容包括:

  • 📁 数据集:文件路径、平台类型(Visium / Xenium)、数据维度、预处理状态
  • 📊 分析记录:使用的方法、参数、执行时间和血缘关系
  • ⚙️ 用户偏好:偏好的聚类方法、图形风格、物种默认值等
  • 🧬 生物学标注:如 cluster 对应的细胞类型、domain 对应的组织区域
  • 🔬 项目上下文:物种、组织类型、疾病模型和研究目标

📖 详细说明: 参见 docs/MEMORY_SYSTEM.md

🔌 扩展能力:MCP 与 Skill Builder

OmicsClaw 的扩展设计主要体现在两个方面:

  • Model Context Protocol(MCP):可将符合标准的 MCP 服务器接入 OmicsClaw,使其能够访问外部 API、学术数据库、自定义执行环境或企业内部数据服务。可在交互会话中通过 /mcp 管理。
  • omics-skill-builder:位于 skills/orchestrator/。它可以根据对话意图或 Python 片段生成可复用的技能脚手架,包括 Python 包装层、SKILL.md 和注册信息。

支持的领域

领域 技能数 主要能力
空间转录组 16 质控、聚类、注释、解卷积、空间统计、通讯、速度、轨迹、微环境提取
单细胞组学 14 质控、过滤、预处理、双细胞检测、注释、轨迹、批次整合、差异分析、GRN、scATAC 预处理
基因组学 10 变异检测、比对、注释、结构变异、组装、单倍型分相、CNV
蛋白组学 8 质谱质控、肽段鉴定、定量、差异丰度、PTM 分析
代谢组学 8 峰检测、XCMS 预处理、注释、归一化、统计分析
Bulk RNA-seq 13 FASTQ 质控、比对、计数质控、ID 映射、批次校正、差异分析、剪接、富集、解卷积、共表达、PPI、生存分析、轨迹插值
Orchestrator 2 多组学查询路由、命名流水线、技能脚手架生成
Literature 1 文献解析、GEO / PubMed 信息提取、数据下载

支持的平台 / 数据类型包括: Visium、Xenium、MERFISH、Slide-seq、10x scRNA-seq、Illumina / PacBio、LC-MS/MS、Bulk RNA-seq(CSV / TSV)

📋 完整技能目录: 见下方 技能总览

技能总览

空间转录组(16 个技能)

  • 基础流程spatial-preprocess — 质控、归一化、聚类、UMAP
  • 分析技能spatial-domainsspatial-annotatespatial-deconvspatial-statisticsspatial-genesspatial-despatial-conditionspatial-microenvironment-subset
  • 高级分析spatial-communicationspatial-velocityspatial-trajectoryspatial-enrichmentspatial-cnv
  • 整合与配准spatial-integratespatial-register
  • 编排路由:可通过顶层 orchestrator 处理跨领域请求和多步流水线
展开查看全部空间转录组技能
技能 说明 主要方法
spatial-preprocess 质控、归一化、高变基因、PCA、UMAP、聚类 Scanpy
spatial-domains 组织区域 / niche 识别 Leiden, Louvain, SpaGCN, STAGATE, GraphST, BANKSY, CellCharter
spatial-annotate 细胞类型注释 Marker-based (Scanpy), Tangram, scANVI, CellAssign
spatial-deconv 细胞比例估计 FlashDeconv, Cell2location, RCTD, DestVI, Stereoscope, Tangram, SPOTlight, CARD
spatial-statistics 空间自相关与网络拓扑分析 Moran's I, Geary's C, Getis-Ord Gi*, Ripley's L, Co-occurrence, Centrality
spatial-genes 空间变异基因识别 Moran's I, SpatialDE, SPARK-X, FlashS
spatial-de 差异表达分析 Wilcoxon, t-test, PyDESeq2
spatial-condition 条件间比较 Pseudobulk DESeq2
spatial-microenvironment-subset 按空间半径提取局部邻域 KDTree, Scanpy
spatial-communication 配体-受体通讯推断 LIANA+, CellPhoneDB, FastCCC, CellChat
spatial-velocity RNA velocity / 细胞动力学分析 scVelo, VELOVI
spatial-trajectory 发育轨迹推断 CellRank, Palantir, DPT
spatial-enrichment 通路富集分析 GSEA, ssGSEA, Enrichr
spatial-cnv 拷贝数变异推断 inferCNVpy, Numbat
spatial-integrate 多样本整合 Harmony, BBKNN, Scanorama
spatial-register 空间配准 PASTE, STalign

单细胞组学(14 个技能)

  • 基础流程sc-qcsc-filtersc-preprocessingsc-ambient-removalsc-doublet-detection
  • 分析技能sc-cell-annotationsc-desc-markers
  • 高级分析sc-pseudotimesc-velocitysc-grnsc-cell-communication
  • 整合sc-batch-integration
  • ATACscatac-preprocessing
展开查看全部单细胞技能
技能 说明 主要方法
sc-qc 计算并可视化质控指标 Scanpy QC
sc-filter 按阈值过滤细胞和基因 Rule-based filtering
sc-preprocessing 归一化、高变基因、PCA、UMAP Scanpy, Seurat, SCTransform
sc-ambient-removal 去除 ambient RNA 污染 CellBender, SoupX, simple
sc-doublet-detection 识别并去除双细胞 Scrublet, DoubletFinder, scDblFinder
sc-cell-annotation 细胞类型注释 markers, CellTypist, SingleR
sc-de 差异表达分析 Wilcoxon, t-test, DESeq2 pseudobulk
sc-markers Marker gene 发现 Wilcoxon, t-test, logistic regression
sc-pseudotime 拟时序与轨迹分析 PAGA, DPT
sc-velocity RNA velocity scVelo
sc-grn 基因调控网络推断 pySCENIC
sc-cell-communication 配体-受体通讯分析 builtin, LIANA, CellChat
sc-batch-integration 多样本整合 Harmony, scVI, BBKNN, Scanorama, fastMNN, Seurat CCA/RPCA
scatac-preprocessing scATAC-seq 预处理与聚类 TF-IDF, LSI, UMAP, Leiden

基因组学(10 个技能)

  • 基础流程genomics-qcgenomics-alignmentgenomics-vcf-operations
  • 分析技能genomics-variant-callinggenomics-variant-annotationgenomics-sv-detectiongenomics-cnv-calling
  • 高级分析genomics-assemblygenomics-phasinggenomics-epigenomics
展开查看全部基因组技能
技能 说明 主要方法 / 指标
genomics-qc FASTQ 质控:Phred、GC/N 含量、Q20/Q30、接头检测 FastQC, fastp, MultiQC
genomics-alignment 比对统计:MAPQ、比对率、insert size、重复率 BWA-MEM2, Bowtie2, Minimap2
genomics-vcf-operations VCF 解析、多等位位点处理、Ti/Tv、QUAL/DP 过滤 bcftools, GATK SelectVariants
genomics-variant-calling 变异分类与质量评估 GATK HaplotypeCaller, DeepVariant, FreeBayes
genomics-variant-annotation 功能影响注释 VEP, SnpEff, ANNOVAR
genomics-sv-detection 结构变异检测 Manta, Delly, Lumpy, Sniffles
genomics-cnv-calling 拷贝数变异分析 CNVkit, Control-FREEC, GATK gCNV
genomics-assembly 组装质量评估 SPAdes, Megahit, Flye, Canu
genomics-phasing 单倍型分相 WhatsHap, SHAPEIT5, Eagle2
genomics-epigenomics 峰分析与 assay 特异指标 MACS2/MACS3, Homer, Genrich

蛋白组学(8 个技能)

  • 基础流程proteomics-data-importproteomics-ms-qc
  • 分析技能proteomics-identificationproteomics-quantificationproteomics-de
  • 高级分析proteomics-ptmproteomics-enrichmentproteomics-structural
展开查看全部蛋白组技能
技能 说明 主要方法
proteomics-data-import 原始数据转换为开放格式 ThermoRawFileParser, msconvert
proteomics-ms-qc 质谱质控 PTXQC, rawtools
proteomics-identification 肽段与蛋白鉴定 MaxQuant, MSFragger, Comet
proteomics-quantification 无标或同位素标记定量 DIA-NN, Skyline, FlashLFQ
proteomics-de 差异丰度分析 MSstats, limma
proteomics-ptm 翻译后修饰分析 PTM-prophet, MaxQuant
proteomics-enrichment 蛋白通路富集 Perseus, clusterProfiler
proteomics-structural 三维结构与交联分析 AlphaFold, xQuest

代谢组学(8 个技能)

  • 基础流程metabolomics-peak-detectionmetabolomics-xcms-preprocessingmetabolomics-normalization
  • 分析技能metabolomics-annotationmetabolomics-quantificationmetabolomics-statisticsmetabolomics-de
  • 高级分析metabolomics-pathway-enrichment
展开查看全部代谢组技能
技能 说明 主要方法
metabolomics-peak-detection 峰检测与峰形过滤 scipy.signal.find_peaks, peak widths
metabolomics-xcms-preprocessing LC-MS / GC-MS 峰提取、对齐和特征分组 XCMS centWave (Python simulation)
metabolomics-normalization 归一化与尺度变换 Median, Quantile, TIC, PQN, Log2
metabolomics-annotation 代谢物注释与多加合物支持 HMDB m/z matching, adduct support
metabolomics-quantification 特征定量、缺失值填补与归一化 Min/2, median, KNN imputation, TIC / median / log norm
metabolomics-statistics 单变量统计与 FDR 校正 Welch's t-test, Wilcoxon, ANOVA, Kruskal-Wallis + BH FDR
metabolomics-de 差异代谢物分析与 PCA 可视化 Welch's t-test + BH FDR, PCA
metabolomics-pathway-enrichment 通路富集分析 Hypergeometric test, KEGG pathways, BH FDR

Bulk RNA-seq(13 个技能)

  • 上游质控bulkrna-read-qc
  • 比对bulkrna-read-alignment
  • 计数矩阵质控bulkrna-qc
  • 预处理bulkrna-geneid-mappingbulkrna-batch-correction
  • 分析技能bulkrna-debulkrna-splicingbulkrna-enrichmentbulkrna-survival
  • 高级分析bulkrna-deconvolutionbulkrna-coexpressionbulkrna-ppi-networkbulkrna-trajblend
展开查看全部 Bulk RNA-seq 技能
技能 说明 主要方法
bulkrna-read-qc FASTQ 质控 FastQC-style Python implementation
bulkrna-read-alignment RNA-seq 比对统计 STAR/HISAT2/Salmon log parsing
bulkrna-qc 计数矩阵质控 pandas, matplotlib, MAD outlier detection
bulkrna-geneid-mapping Gene ID 转换 mygene, built-in tables
bulkrna-batch-correction 批次效应校正 Empirical Bayes, PCA assessment
bulkrna-de 差异表达分析 PyDESeq2, t-test fallback
bulkrna-splicing 可变剪接分析 rMATS/SUPPA2 parsing, delta-PSI
bulkrna-enrichment 通路富集 GSEApy, hypergeometric fallback
bulkrna-deconvolution Bulk 数据细胞成分解卷积 NNLS, CIBERSORTx bridge
bulkrna-coexpression WGCNA 风格共表达网络 Soft thresholding, hierarchical clustering, TOM
bulkrna-ppi-network PPI 网络分析 STRING API, graph centrality, hub genes
bulkrna-survival 生存分析 Kaplan-Meier, log-rank test, Cox PH
bulkrna-trajblend Bulk 到单细胞轨迹插值 NNLS, PCA + KNN mapping, pseudotime

Orchestrator(2 个技能)

  • orchestrator:将请求路由到合适技能,并组织多步流水线
  • omics-skill-builder:自动生成可复用的 OmicsClaw 技能脚手架

Literature(1 个技能)

  • literature:解析 PDF、URL、DOI 等文献来源,提取 GEO 编号和相关数据集信息
展开查看 Literature 技能
技能 说明 主要方法
literature 解析科研论文中的数据集与元数据 GEOparse, pypdf

架构概览

展开查看项目结构与技能布局

OmicsClaw 使用按领域组织的模块化结构:

OmicsClaw/
├── omicsclaw.py              # 主 CLI 入口
├── omicsclaw/                # 与领域无关的核心框架
│   ├── core/                 # 注册中心、技能发现、依赖管理
│   ├── routing/              # 查询路由与编排逻辑
│   ├── loaders/              # 文件格式 / 领域识别
│   ├── common/               # 公共工具(报告、校验等)
│   ├── memory/               # 图结构记忆系统
│   ├── interactive/          # 交互式 CLI / TUI
│   ├── agents/               # Agent 定义
│   ├── knowledge/            # 知识加载辅助模块
│   └── r_scripts/            # 共用 R 侧辅助脚本
├── skills/                   # 自包含分析模块
│   ├── spatial/              # 16 个空间转录组技能 + _lib
│   ├── singlecell/           # 14 个单细胞技能 + _lib
│   ├── genomics/             # 10 个基因组技能 + _lib
│   ├── proteomics/           # 8 个蛋白组技能 + _lib
│   ├── metabolomics/         # 8 个代谢组技能 + _lib
│   ├── bulkrna/              # 13 个 Bulk RNA-seq 技能 + _lib
│   └── orchestrator/         # 跨领域编排
├── knowledge_base/           # 规则、指南和可复用知识
├── bot/                      # 多通道消息接口
├── frontend/                 # Memory Explorer React/Vite 前端
├── website/                  # 官方文档站点
├── docs/                     # 文档(安装、方法、架构等)
├── examples/                 # 示例数据
├── scripts/                  # 工具脚本
├── templates/                # 输出模板
├── tests/                    # 集成与回归测试
├── sessions/                 # 会话状态存储
├── Makefile                  # 构建与快捷命令
└── install_r_dependencies.R  # R 依赖安装脚本

每个技能都是自包含的:

skills/<domain>/<skill>/
├── SKILL.md                  # 方法说明与接口约定
├── <skill_script>.py         # CLI 实现
└── tests/                    # 单元 / 集成测试

技能之间通过标准格式(如 .h5ad.vcf.mzML.csv)进行衔接,也可以组合成流水线。

📱 消息通道集成

OmicsClaw 提供带持久记忆的消息 Bot 接口,可让 CLI 和消息平台共享同一套会话状态。目前支持 Telegram、飞书(Lark)、钉钉、Discord、Slack、微信、QQ、Email 和 iMessage。

# 安装 Bot 基础依赖
pip install -r bot/requirements.txt

# 或安装全部通道依赖
pip install -r bot/requirements-channels.txt

# 准备配置
cp .env.example .env

# 同时启动多个通道
python -m bot.run --channels telegram,feishu,slack

# 或使用 Makefile
make bot-multi CHANNELS=telegram,discord

主要特点:

  • 🧠 持久记忆:跨会话记住数据、分析记录和偏好
  • 💬 自然语言交互:例如“继续做空间结构域识别”,系统会自动选择合适技能
  • 📁 多组学文件支持:支持 .h5ad.vcf.mzML.csv.tsv
  • 📊 结果自动回传:报告和图表可直接发送到聊天窗口
  • 🔒 本地优先:计算在本地执行,仅保存必要元数据

Tip

通道配置、能力矩阵和架构说明请参见 bot/README.md。 记忆系统相关说明请参见 docs/MEMORY_SYSTEM.md

🤖 给 AI Agent 的说明

如果你是一个正在读取此仓库的 AI Agent(例如 OpenClaw、Claude Desktop、Cursor、OpenDevin 或本地 CLI Agent):

用户依赖 OmicsClaw 提供的统一技能体系来完成多组学分析。不要临时拼接零散的 ad-hoc Python 脚本。优先使用 OmicsClaw 已有的标准化工具和图结构记忆系统。

在采取任何操作前,请先阅读以下文件:

  • 📜 llms.txt:项目结构和提示边界的高层说明
  • 🧠 AGENTS.mdoc CLI 用法和记忆系统说明
  • 🤖 CLAUDE.md:定制化 Agent 指令和内部编排约束
  • 🧩 skills/catalog.json:全部 72 个技能的机器可读注册表

建议主动告知用户:

“我会优先使用 OmicsClaw 内置的技能注册表和记忆系统来完成任务,以保证执行的稳定性和一致性。”

👥 团队

角色 姓名 联系方式
负责人(PI) Luyi Tian tian_luyi@gzlab.ac.cn
主导开发者 Weige Zhou GitHub
开发者 Liying Chen GitHub
开发者 Pengfei Yin GitHub

问题反馈和功能建议请通过 GitHub Issues 提交。

🤝 贡献

欢迎生物信息学研究者、计算生物学家以及 AI 开发者参与贡献。如果要添加一个新技能,可以按下面的步骤进行:

  1. 新建技能目录:skills/<domain>/<skill-name>/
  2. 添加 SKILL.md,写明方法说明和接口约定
  3. 实现 <skill_name>.py 的 CLI 接口
  4. tests/ 中补充测试
  5. 运行 python scripts/generate_catalog.py 更新注册表

详细开发规范请参见 AGENTS.md

🌐 社区

欢迎加入 OmicsClaw 用户社区,分享分析经验、反馈问题,一起推动多组学 AI 分析工具的发展。

OmicsClaw 微信交流群
微信交流群
扫码加入体验交流

📚 致谢

OmicsClaw 的设计和实现受到了以下开源项目的重要启发:

  • ClawBio:生物信息学场景下较早的原生 AI agent 技能库之一。OmicsClaw 的技能架构、本地优先理念、可复现性设计和 Bot 集成模式都受到了它的启发。
  • Nocturne Memory:一个轻量、支持回溯的长时记忆服务。OmicsClaw 的持久记忆系统借鉴了其图结构记忆和 MCP 集成思路。

📖 文档

⚠️ 安全与免责声明

  • 本地优先处理:数据默认保留在本机
  • 仅供科研使用:本项目不是医疗器械,不提供临床诊断结论
  • 请由领域专家复核:重要结论应结合专业判断进行确认

📜 许可证

Apache-2.0,详见 LICENSE

📝 引用

如果你在研究中使用了 OmicsClaw,欢迎引用:

@software{omicsclaw2026,
  title = {OmicsClaw: A Memory-Enabled AI Agent for Multi-Omics Analysis},
  author = {Zhou, Weige and Chen, Liying and Yin, Pengfei and Tian, Luyi},
  year = {2026},
  url = {https://github.com/TianGzlab/OmicsClaw}
}