科学工具
科学工具让世界更美好
让世界更美好

II-Researcher智能搜索代理:BAML深度分析与网页抓取II-Researcher智能搜索代理:BAML深度分析与网页抓取

II-Researcher 是一个强大的深度搜索代理,利用 BAML 函数来进行智能的网页搜索,生成对问题的全面回答,能帮助用户更有效地进行研究和信息收集,尤其是在需要深入挖掘和综合分析的场景下。II-Researcher具有智能网页搜索、网页抓取和内容提取、多步骤推理和反思、可配置的LLM模型、异步操作、综合答案生成、可定制的流水线和推理方法等特性。

智能网络搜索

II-Researcher 使用 Tavily 和 SerpAPI 等搜索提供商进行智能网络搜索,能够快速准确地检索信息,生成相关的答案。

内容提取

II-Researcher支持多种内容提取方式,包括 Firecrawl、Browser、BS4 和 Tavily,通过这些工具可以帮助用户从网页中提取所需的信息。

多步推理和反思

II-Researcher 具备多步推理和反思的能力,能够处理复杂的问题并给出合理的答案。

可配置的大语言模型

框架支持配置不同任务的大语言模型(LLM),以适应各种应用场景。

异步操作

为了提高性能,II-Researcher 支持异步操作,能够在处理大量数据时保持高效。

综合答案生成

II-Researcher能够生成包含引用信息的综合答案,保证信息的准确性和可靠性。

可定制的管道和推理方法

II-Researcher 支持可定制的管道和推理方法,允许用户根据具体需求调整系统行为。

安装和设置

克隆仓库

克隆 II-Researcher 的 GitHub 仓库:

git clone https://github.com/Intelligent-Internet/ii-researcher.git
cd ii-researcher

安装包

在开发模式下安装包:

pip install -e .

设置环境变量

根据需要设置 API 密钥和其他环境变量。例如:

export OPENAI_API_KEY="your-openai-api-key"
export TAVILY_API_KEY="your-tavily-api-key"
export SERPAPI_API_KEY="your-serpapi-api-key"
export FIRECRAWL_API_KEY="your-firecrawl-api-key"

配置环境

根据需要配置其他环境变量,如 API 端点、压缩设置、搜索和抓取配置等。

使用方法

命令行界面

使用命令行界面运行深度搜索代理:

Pipeline 模式:适用于一般问题和任务。

python cli.py --question "your question here"

Reasoning 模式:适用于复杂问题和任务。

python cli.py --question "your question here" --use-reasoning --stream

Web 界面

安装运行后端 API,在前端目录中创建 .env 文件,配置 API URL,然后安装前端依赖,启动开发服务器。

运行 Docker

在设置完成所有环境变量后,使用 Docker Compose 启动服务:

docker compose up --build -d

服务将在以下地址可用:

• 前端:http://localhost:3000 • 后端:http://localhost:8000

查看日志:

docker compose logs -f

停止服务:

docker compose down

使用 Qwen/QwQ-32B 模型

使用 SGLang 运行 Qwen/QwQ-32B 模型:

python3 -m sglang.launch_server --model-path Qwen/QwQ-32B --host 0.0.0.0 --port 30000 --tp 8 --context-length 131072