现在的 AI 不止会写新闻,还会写书了。 学术出版商 Springer Nature 出版了第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》,它概述了锂离子电池领域的最新研究成果。 / I/ N- V s! j7 N2 y0 N+ V

0 n. H4 c( ?$ g: k, K+ m! V
AI 是如何写出一本书的? 这里面用到的技术,是一种由 Springer Nature 和法拉克福歌德大学共同开发的一种先进算法:Beta Writer。 ! z& F6 Y t0 E0 d; Y
它使用的是基于相似性的聚类分析,将海量的源文档排列成连贯的章节,然后创建文章的简洁摘要,同时,将文章内部加入超链接,这样利于读者进一步阅读原始的文章。 而 AI 这种创新化的结构化摘录成书,有利于研究人员更高效地管理海量信息,以及人们从海量内容里快速选择、使用和处理相关领域的文档。 $ w4 U: c: i5 B

4 ]% h; f' G- q d
所以确切来说,它其实是该学科里面大量研究文章的摘要合集。 但摘要并不是你想的那么简单,这本书里面包含了 2016 年到 2018 年发表过的 150 多篇权威研究论文。仅在过去 3 年,关于锂电子电池的研究论文就发表了超出 53000 篇,这对试图学习这一领域的科学家是一个巨大的挑战,但 AI 的自动扫描和总结输出,能让科学家们把更多时间用在重要的研究上。 ( J- G( l8 r, {$ L7 }5 l

▲ 图片来自:The Verge,摄影:Adam Berry/Getty Images ) ]9 H) ~3 z! `# z7 E R$ w+ {
虽然它可能和我们想象中的「文采飞扬」、「驰骋墨场」相差千里,但目前它也为研究人员或专业人士展现了一种获取信息的未来方式。 几十年来,机器一直在学习人类语言的微妙之处,虽然深度学习算法不断在更新技术,但就算世界上最能写的 AI 也无法表达出人的独特思想。
* z, @3 z0 N; i" ^
不过前几个月 OpenAI 发布一个名为 GPT-2 的新算法,给它一个标题就能进行语言建模完成接下来的情节,最特别的地方就是能够更灵活地变动内容,甚至写出一篇粉丝小说。
+ N# L; m; e+ p, [4 i& F

9 [; {, }+ P) t. l! a H
▲ 图片来自:openai
`; Q; m6 e: Z' j: [5 g G8 J
+ n. p H$ s! y% j+ I- o可以预见,未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完全由机器学习生成的文本。 而对于这本书的情况,Springer Nature 的董事总经理 Niels Peter Thomas 说道: & B+ U5 x" a( j3 P* g
围绕自然语言处理和人工智能的新技术,为我们提供了在算法帮助下探索内容生成的新机会。作为全球出版商,我们也有责任考虑机器生成内容的影响、机遇、挑战和风险,并为未来的这类新内容提供基础的框架。
5 b0 d8 d" E4 @' h Z$ s

3 c1 i& ?6 w: H# }2 e* E: i. y
▲ 图片来自:medium 6 Q: c: A8 l& u
目前 Springer Nature 计划通过开发其他领域的内容来扩展这次的试点项目。而《锂离子电池研究原型》也将成为进一步改进此类技术的基础。 如果你想读一下的话,SpringerLink 数据库里现在也免费为读者提供了电子书版本。 4 ^8 Y; M! `* f% H& n0 C
但或许我们更期待看到的是,AI 直接创造出的不仅是文字方面的协助,而是基于文字本身的更有价值的内容。 毕竟每个人的思维都有限,而算法拥有无限可能。
/ o0 y! \" h! O: B8 f( b- ? |