开源
ChatPaper:论文总结工具
来源:元经纪     阅读:1167
网站管理员
发布于 2023-03-27 02:40
查看主页

概述

总结 arXiv 论文。

使用步骤

Windows、Mac 和 Linux 系统应该都可以

python版本最好是3.9,其他版本应该也没有啥问题

  1. [hidecontent type="logged" desc="隐藏内容:登录后可查看"]

    1. 在apikey.ini中填入你的openai key。注意,这个代码纯本项目,你的key很安全!如果不被OpenAI封号的话~小能白用户比较多,我直接给截图更显示

    1. 使用过程要保证全面代理! 如果客户端发生冲突的对话,可以参考这个进行配置:

    1. 安装依赖:
    pip install -r requirements.txt

    4.1. Arxiv在线批量搜索+下载+总结: 运行chat_paper.py,例如:

    python chat_paper.py --query "chatgpt robot" --filter_keys "chatgpt robot" --max_results 3

    注意:搜索词无法知识-,只能识别空间!所以原标题的连字符最好不要用!感谢网友提供的信息

    4.2. Arxiv在线批量搜索+下载+总结+高级搜索:运行chat_paper.py,比如:

    python chat_paper.py --query "all: reinforcement learning robot 2023" --filter_keys "reinforcement robot" --max_results 3

    4.3. Arxiv在线批量搜索+下载+总结+高级搜索+指定作者:运行chat_paper.py,例如:

    python chat_paper.py --query "ti: Sergey Levine" --filter_keys "reinforcement robot" --max_results 3

    4.4. 本地pdf总结:运行chat_paper.py,比如:

    python chat_paper.py --pdf_path "demo.pdf"

    4.5. 本地区文件夹批总结:运行chat_paper.py,比如:

    python chat_paper.py --pdf_path "your_absolute_path"

    B站讲视频:我把ChatPaper打开了!AI速读PDF论文和速通Arxiv论文

    注意:key_word不重要,但是filter_keys非常重要! 一定要修改成你的关键词。

    其他关于arxiv的搜索关键词可以参考下图:

    1. 参数介绍:

    [--pdf_path 是否直接读取本地的pdf文档?如果不设置的话,直接从arxiv上搜索并且下载] [--query 向arxiv网站搜索的关键词,有一些缩写示范:all, ti(title), au(author),一个query示例:all: ChatGPT robot] [--key_word 你感兴趣领域的关键词,重要性不高] [--filter_keys 你需要在摘要文本中搜索的关键词,必须保证每个词都出现,才算是你的目标论文] [--max_results 每次搜索的最大文章数,经过上面的筛选,才是你的目标论文数,chat只总结筛选后的论文] [--sort arxiv的排序方式,默认是相关性,也可以是时间,arxiv.SortCriterion.LastUpdatedDate 或者 arxiv.SortCriterion.Relevance, 别加引号] [--save_image 是否存图片,如果你没注册gitee的图床的话,默认为false] [--file_format 文件保存格式,默认是markdown的md格式,也可以是txt]

    parser.add_argument("--pdf_path", type=str, default='', help="if none, the bot will download from arxiv with query") parser.add_argument("--query", type=str, default='all: ChatGPT robot', help="the query string, ti: xx, au: xx, all: xx,") parser.add_argument("--key_word", type=str, default='reinforcement learning', help="the key word of user research fields") parser.add_argument("--filter_keys", type=str, default='ChatGPT robot', help="the filter key words, 摘要中每个单词都得有,才会被筛选为目标论文") parser.add_argument("--max_results", type=int, default=1, help="the maximum number of results") parser.add_argument("--sort", default=arxiv.SortCriterion.Relevance, help="another is arxiv.SortCriterion.LastUpdatedDate") parser.add_argument("--save_image", default=False, help="save image? It takes a minute or two to save a picture! But pretty") parser.add_argument("--file_format", type=str, default='md', help="导出的文件格式,如果存图片的话,最好是md,如果不是的话,txt的不会乱")

    解析示例

    查看解析结果

    使用技巧

    快速刷特定关键词的论文,不插图的话,每张篇文章需要花一分钟,阅读时间差不多一分钟。

    本项目可以用于跟踪领域最新论文,或者关注其他领域的论文,可以批量生成总结,最大可生成1000(如果你能等得及的话)。 虽然Chat可能有瞎编的成分,但是在我的规范化提问的框架下,它的主要信息是保熟的。

    数字部分需要大家重新去原文检查!

    找到好的文章之后,可以精读这篇文章。

    推荐另外两个精读论文的AI辅助网站:https://typeset.io/ 和chatpdf。 我的教程: 强化学徒:论文阅读神器SciSpace(Typeset.io)测评-和AI一起进化

    和上面这两个工具的主要优势在于,ChatPaper可以批量自动总结最新论文,可以极大的降低阅读门槛,尤其是我们国人。 缺点也很明显,ChatPaper没有交互功能,不能连续提问,但我觉得这个重要性不大~

    常见报错

    pip 安装错误:

    推荐关掉梯子,使用国内源下载:

    pip install -r requirements.txt -i  http://pypi.douban.com/simple  --trusted-host pypi.douban.com
    1. 调用openai的api时出现APIConnectionError, 如何解决? 参考知乎回答: https://www.zhihu.com/question/587322263/answer/2919916984

    直接在chat_paper.py里加上

    os.environ["http_proxy"] = "http://<代理ip>:<代理端口>" os.environ["https_proxy"] = "http://<代理ip>:<代理端口>"

    代理ip和端口需要你在Windows系统里面查找。

    1. API被OpenAI禁了的报错:

    这种情况只能用新号了。另外一定要注意一个号尽量不要多刷,节点一定要靠谱,千万不能用大陆和香港的节点,用了就寄。

    [/hidecontent]

免责声明:本文为用户发表,不代表网站立场,仅供参考,不构成引导等用途。 开源
全国首次!广电5G 700MHz“黄金频段”应急通信无人机试飞成功
江苏省发布元宇宙产业三年行动计划 到2026年规模突破1000亿元
中国元宇宙产业发展开始发力
释放银发经济发展新动能(走进进博会)
电动汽车“移动充电宝”、术后无创“缝合卫士”、智能巡逻无人机 桐庐这场路演 大学生的创意不得了

首页

分类

定制方案

消息

我的