ChatPaper：论文总结工具

概述

总结 arXiv 论文。

使用步骤

Windows、Mac 和 Linux 系统应该都可以

python版本最好是3.9，其他版本应该也没有啥问题

[hidecontent type="logged" desc="隐藏内容：登录后可查看"]
1. 在apikey.ini中填入你的openai key。注意，这个代码纯本项目，你的key很安全！如果不被OpenAI封号的话~小能白用户比较多，我直接给截图更显示
1. 使用过程要保证全面代理！如果客户端发生冲突的对话，可以参考这个进行配置：
1. 安装依赖：
```
pip install -r requirements.txt
```
4.1. Arxiv在线批量搜索+下载+总结：运行chat_paper.py，例如：
```
python chat_paper.py --query "chatgpt robot" --filter_keys "chatgpt robot" --max_results 3
```
注意：搜索词无法知识-，只能识别空间！所以原标题的连字符最好不要用！感谢网友提供的信息

4.2. Arxiv在线批量搜索+下载+总结+高级搜索：运行chat_paper.py，比如：
```
python chat_paper.py --query "all: reinforcement learning robot 2023" --filter_keys "reinforcement robot" --max_results 3
```
4.3. Arxiv在线批量搜索+下载+总结+高级搜索+指定作者：运行chat_paper.py，例如：
```
python chat_paper.py --query "ti: Sergey Levine" --filter_keys "reinforcement robot" --max_results 3
```
4.4. 本地pdf总结：运行chat_paper.py，比如：
```
python chat_paper.py --pdf_path "demo.pdf"
```
4.5. 本地区文件夹批总结：运行chat_paper.py，比如：
```
python chat_paper.py --pdf_path "your_absolute_path"
```
B站讲视频：我把ChatPaper打开了！AI速读PDF论文和速通Arxiv论文

注意：key_word不重要，但是filter_keys非常重要！ 一定要修改成你的关键词。

其他关于arxiv的搜索关键词可以参考下图：
1. 参数介绍：
[--pdf_path 是否直接读取本地的pdf文档？如果不设置的话，直接从arxiv上搜索并且下载] [--query 向arxiv网站搜索的关键词，有一些缩写示范：all, ti(title), au(author)，一个query示例：all: ChatGPT robot] [--key_word 你感兴趣领域的关键词，重要性不高] [--filter_keys 你需要在摘要文本中搜索的关键词，必须保证每个词都出现，才算是你的目标论文] [--max_results 每次搜索的最大文章数，经过上面的筛选，才是你的目标论文数，chat只总结筛选后的论文] [--sort arxiv的排序方式，默认是相关性，也可以是时间，arxiv.SortCriterion.LastUpdatedDate 或者 arxiv.SortCriterion.Relevance，别加引号] [--save_image 是否存图片，如果你没注册gitee的图床的话，默认为false] [--file_format 文件保存格式，默认是markdown的md格式，也可以是txt]
parser.add_argument("--pdf_path", type=str, default='', help="if none, the bot will download from arxiv with query") parser.add_argument("--query", type=str, default='all: ChatGPT robot', help="the query string, ti: xx, au: xx, all: xx,") parser.add_argument("--key_word", type=str, default='reinforcement learning', help="the key word of user research fields") parser.add_argument("--filter_keys", type=str, default='ChatGPT robot', help="the filter key words, 摘要中每个单词都得有，才会被筛选为目标论文") parser.add_argument("--max_results", type=int, default=1, help="the maximum number of results") parser.add_argument("--sort", default=arxiv.SortCriterion.Relevance, help="another is arxiv.SortCriterion.LastUpdatedDate") parser.add_argument("--save_image", default=False, help="save image? It takes a minute or two to save a picture! But pretty") parser.add_argument("--file_format", type=str, default='md', help="导出的文件格式，如果存图片的话，最好是md，如果不是的话，txt的不会乱")
解析示例

查看解析结果

使用技巧

快速刷特定关键词的论文，不插图的话，每张篇文章需要花一分钟，阅读时间差不多一分钟。

本项目可以用于跟踪领域最新论文，或者关注其他领域的论文，可以批量生成总结，最大可生成1000（如果你能等得及的话）。虽然Chat可能有瞎编的成分，但是在我的规范化提问的框架下，它的主要信息是保熟的。

数字部分需要大家重新去原文检查！

找到好的文章之后，可以精读这篇文章。

推荐另外两个精读论文的AI辅助网站：https://typeset.io/ 和chatpdf。我的教程：强化学徒：论文阅读神器SciSpace(Typeset.io)测评-和AI一起进化

和上面这两个工具的主要优势在于，ChatPaper可以批量自动总结最新论文，可以极大的降低阅读门槛，尤其是我们国人。缺点也很明显，ChatPaper没有交互功能，不能连续提问，但我觉得这个重要性不大~

常见报错

pip 安装错误：

推荐关掉梯子，使用国内源下载：
pip install -r requirements.txt -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
1. 调用openai的api时出现APIConnectionError, 如何解决? 参考知乎回答： https://www.zhihu.com/question/587322263/answer/2919916984
直接在chat_paper.py里加上

os.environ["http_proxy"] = "http://<代理ip>:<代理端口>" os.environ["https_proxy"] = "http://<代理ip>:<代理端口>"

代理ip和端口需要你在Windows系统里面查找。
1. API被OpenAI禁了的报错：
这种情况只能用新号了。另外一定要注意一个号尽量不要多刷，节点一定要靠谱，千万不能用大陆和香港的节点，用了就寄。
[/hidecontent]

概述

使用步骤

解析示例

使用技巧

常见报错