类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中-天气在线（北京）气象科技有限公司-人工智能AI短临预报-AI模式修订与评估-气象大数据-气象数据服务

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

2023-08-07 09:09:33 点击：

转载于 ScienceAI 公众号

编辑|白菜叶

人工智能驱动的会话式聊天机器人已经出现在互联网搜索引擎中，例如谷歌的Bard和微软的Bing，看起来也将越来越多地改变科学文献搜索方式。8月1日，荷兰出版巨头Elsevier为其Scopus数据库的部分用户发布了由ChatGPT支持的AI界面，而英国公司Digital Science则宣布对其Dimensions数据库进行AI大语言模型(LLM)助手的封闭试验。与此同时，美国Clarivate公司表示，它也在努力将LLM纳入其Web of Science数据库。

用于科学搜索的LLM并不新鲜：Elicit、Scite和Consensus等初创公司已经拥有此类人工智能系统，有助于总结某个领域的发现或识别顶尖研究，依靠免费的科学数据库或（在Scite的例子中）通过与出版商合作获得付费研究文章。但拥有大型科学摘要和参考文献专有数据库的公司现在也加入了人工智能热潮。

负责该工具开发的Elsevier驻伦敦高管Maxim Khan表示，Elsevier的聊天机器人名为Scopus AI，作为试点推出，旨在作为一种轻便、有趣的工具，帮助研究人员快速获得他们不熟悉的研究主题的摘要。为了回答自然语言问题，机器人使用LLM GPT-3.5版本返回有关研究主题的流畅摘要段落，以及引用的参考文献和要探索的进一步问题。

对于搜索（尤其是科学搜索）的LLM的一个担忧是它们不可靠。LLM无法理解他们所写的文字；它们的工作方式很简单，就是吐出风格上合理的词语。正如学者们很快发现的那样，他们的输出可能包含事实错误和偏见，并且可能会编造不存在的参考资料。

因此，Scopus AI受到限制：它只能通过参考五到十份研究摘要来生成答案。人工智能本身不会找到这些摘要：相反，在用户输入查询后，传统搜索引擎会返回与问题相关的摘要，Khan解释道。

虚假事实

关注人工智能搜索工具的新加坡管理大学（Singapore Management University）图书馆员Aaron Tay指出，许多其他人工智能搜索引擎系统也采用了类似的策略。这有时被称为检索增强生成，因为LLM仅限于总结另一个搜索引擎检索的相关信息。「LLM仍然偶尔会产生幻觉或编造故事。」Tay说道，他指的是对互联网搜索人工智能聊天机器人的研究，例如Bing和Perplexity，它们使用类似的技术。

Elsevier 将其人工智能产品限制为仅搜索2018年以来发表的文章，以获取最近的论文，并指示其聊天机器人在回复中适当引用返回的摘要，从而避免不安全或恶意查询，并说明收到的摘要中是否没有相关信息。这不能避免错误，但可以最大限度地减少错误。Elsevier还通过为机器人的「温度」选择较低的设置来降低其人工智能的不可预测性——这是一种衡量机器人在响应中选择偏离最合理词语的频率的指标。

用户是否可以简单地将机器人的段落复制并粘贴到自己的论文中，从而有效地抄袭该工具？Khan说，这是有可能的。他说，到目前为止，Elsevier已经通过指导来解决这个问题，要求研究人员负责任地使用这些摘要。Khan指出，资助者和出版商也发布了类似的指导意见，要求透明披露LLM是否用于撰写论文或进行同行评审，或者在某些情况下声明根本不应该使用LLM。

目前，该工具仅向大约15,000名用户（Scopus订阅者的一部分）推出。Elsevier表示预计将于2024年初全面推出。

全文分析

同样在8月1日，Digital Science宣布为其大型Dimensions科学数据库推出人工智能助手，目前仅适用于选定的Beta测试人员。与Scopus AI不同，用户输入问题后，搜索引擎首先检索相关文章，然后Open AI GPT模型围绕已检索到的排名靠前的摘要生成摘要段落。

「非常相似，有趣的是。」该公司首席产品官Christian Herzog说。（Digital Science隶属于Holtzbrinck出版集团，该集团是《Nature》杂志出版商Springer Nature的大股东。）

Dimensions 还利用LLM提供有关相关论文的更多详细信息，包括其研究结果的简短改写摘要。

Herzog 表示，该公司希望在今年年底之前更广泛地发布其工具，但目前正在与科学家、资助者和其他使用Dimensions的人合作，从而测试LLM可能在哪些方面有效——这还有待观察。「这是为了逐渐适应新技术并建立信任。」他说。

Tay 表示，他期待能够在论文全文（而不仅仅是摘要）上使用LLM的工具。他指出，Elicit等网站已经允许用户使用LLM来回答有关论文全文的详细问题——当机器人可以访问它时，就像一些开放获取的文章一样。

与此同时，Clarivate的「academia and government segment」负责人Bar Veinstein表示，该公司「正在致力于在Web of Science中添加LLM支持的搜索」，指的是有两家公司于6月份宣布与以色列特拉维夫AI21 Labs签署的战略合作伙伴关系。然而，Veinstein没有给出基于LLM的Web of Science工具的发布时间表。

相关报道：https://www.nature.com/articles/d41586-023-02470-3

上一篇：没有啦
下一篇：基于机器学习的冰雹天气识别研究 2023/8/4