手机版 募格英语
首页 论文润色 论文翻译 全程发表 书稿服务 编辑团队 范例评价 科研资源 质保及FAQ
打造科学家自己的搜索引擎
来源: 【生物360】 阅读次数: 【】 发布日期:【2015-01-15】
       当海洋学家Peter Wiebe近期打算写一篇今年1月乘船去红海的文章时,他想检索这一地区所有浮游生物的数据。他知道其他研究人员多年来已经在积累相关有机物样本,但有个问题:他不知道在哪里可以找到这些资料。
       “这些数据中心是一种‘黑洞’。”在美国马萨诸塞州伍兹霍尔海洋研究所工作的Wiebe说,“数据已被录入,但是很难指出哪里存了哪些资料以及如何获取这些资料。”
       这种局面很快将改变。
       Wiebe正在和一组计算机学家一起工作,为智能学术搜索引擎奠定基础,该引擎将帮助地球学家眨眼间找到他们想要的确切数据集和出版物,而不是花费数小时在谷歌学术网上逐页翻寻毫不相关的文章。该小组近期在旧金山举行的美国地球物理学会(AGU)会议上正式启动了这项名为GeoLink的项目。该项目是EarthCube计划的一部分,该计划由美国国家科学基金会(NSF)资助,旨在升级地球科学的网络基础设施。
       未来两年,Wiebe与同事将建立可以从AGU会议摘要、NSF奖以及地球科学数据库提取数据的计算机程序,然后通过数字化方式把这些资源相互连接,使科学家更容易获取相关数据。今年已完工的一项叫OceanLink的试点项目已经拓展了其中的部分基础设计。弗吉尼亚州玛丽蒙特大学计算机学家Tom Narock说,如果新项目可以获得科学界的足够兴趣,研究人员最终将把它变成一项综合的地球科学一站式搜索中心。
       类似GeoLink的项目是科学界通过利用计算机不断增加的文献处理能力让文献回顾更加有效的一部分工作,随着每年出现数以百万计的新论文,这一服务功能的必要性越来越迫切。华盛顿西雅图艾伦人工智能研究所(AI 2)的一项类似计划正在为计算机科学研发一种智能学术搜索引擎。这项被称为“Semantic Scholar”的计划有望在2015年年底问世。AI 2执行总裁Oren Etzioni说,该机构计划最终扩大Semantic Scholar的覆盖范围并包含其他的科目。
       现有学术搜索引擎以广泛覆盖科学文献而著称(经计算单是谷歌学术搜索引擎就包含1600万条文献索引)。然而,它们需要依赖关键词搜索,这意味着用户搜到的垃圾信息往往远超有价值的信息。而且这些搜索引擎通常也不能还原原始数据集。
       相比较而言,GeoLink和Semantic Scholar试图建立迎合专业领域需求的精细分类搜索引擎,通过帮助计算机在出版物之间建立科学有效的联系,挖掘更深的语义处理信息。比如,Wiebe输入“红海浮游生物”后,搜索引擎就会明白这是论文中出现的字符串,而且还会知道研究该领域的研究人员、他们使用的油轮和器材以及他们的数据集和论文。
       谷歌也使用了类似技术提升其主要搜索引擎,但是诸如GeoLink这样的项目得益于在某个领域具有广泛知识的研究人员输入的资料,科学家会区别出有效的连接,然后计算机学家把它们转化成代码。生物医药研究人员在建立细化、分科的专用引擎方面一直走在前沿。比如,PubMed就利用其“医学主标题”(MSH)引擎简化其查询系统。
       宾夕法尼亚州立大学计算机学家C. Lee Giles表示,这些项目的潜力远远超过帮助科学家迅速找到需要的论文。通过从论文中提取信息并把这些数据合并在一起, 类似Semantic Scholar这样的搜索引擎还可以操作文献评议与对比过程。
       Etzioni举例说,一个有天分的计算机系毕业生需要花费数周广泛阅读依存分析(一种计算机自然语言处理任务),才能大致掌握过去5年中所使用的基本技术、产生的数据集及其准确率。比较来看,Semantic Scholar数秒钟之内就可以编译这些技术与结果。“我们设想的不仅是远远超过论文推荐之类的技术,同时做出实实在在的新发现。”Etzioni说。
       丹麦哥本哈根大学计算机学家Christina Lioma说,这样的即时概括能力尤其将惠及那些刚进入一个新研究领域的青年科学家和跨学科研究人员。Giles表示,它还可以让科学家分辨出某一领域出现的科学趋势,并以此为依据调整研究方向。
       然而,挖掘这项技术的潜力部分还要依赖可供计算机阅读的可采集到的文本,这使得学者和出版商处于竞争对立面。目前,GeoLink项目只能采集可以公开获取的研究摘要。(Semantic Scholar会覆盖400万篇可以公开获取的计算机领域的科学论文。)Giles表示,目前,科学家仍须做大量工作提高文本处理的准确性。然而,他相信语义搜索方法代表着“未来网络”。
作者 : H. J. Zhang
专业 : 物理学
期刊名称 : Physical Review Letters
影响因子 : 7.512
作者 : Yong Chen
专业 : 材料科学
期刊名称 : Journal of Materials Chemistry A
影响因子 : 7.443
作者 : Nan Liu
专业 : 临床医学
期刊名称 : Biosensors and Bioelectronics
影响因子 : 6.409
查看更多案例
您好!这里是募格编辑,请问有什么可以帮您的?
服务说明 加急服务 提交订单
服务说明 提交订单
服务说明 提交订单
留学文书润色 简历润色 提交润色订单 留学文书翻译 简历翻译 提交翻译订单
发表案例 标准润色范例 深度润色范例 翻译范例 客户评价
书稿润色 书稿翻译
软件教程 写作教程 学术论文群 资讯中心 期刊投稿指南
常见问题 服务流程 支付流程 担保支付 优惠活动 质量管理 发票开具规则 募格公告 学术伦理道德