测评数据超越GPT-4,谷歌推出全新AI模型Gemini

类别:业界动态  出处:中国电子报  发布于:2023-12-08 10:16:37 | 347 次阅读

 

    谷歌宣布推出其“通用、功能强大”的新大型语言模型Gemini 1.0。

  据介绍,针对不同场景,Gemini 1.0包含三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。
  在模型架构方面,Gemini 1.0采用Transformer架构,采用高效的Attention机制,支持32K的上下文长度。此外,该模型具有复杂多模态推理能力,可以同时识别文本、图像、音频、视频和代码五种信息。它能够发现大量数据中难以辨别的知识,因此能够更好地理解微妙的信息,并回答复杂的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。
  例如,Gemini 能够独立批改物理作业,在正确“读懂”题目、识别凌乱手写笔迹的同时,指出学生在解题过程中的错误,并给出正确答题步骤。通过图像和语音输入,Gemini可以指导做菜,并在不同阶段提出相应的建议。
  在编码能力上,Gemini可以理解、解释和生成世界上的编程语言(如Python、Java、C++和Go)的高质量代码。同时,Gemini还可以用作更编码系统的引擎。
  谷歌声称,Gemini Ultra以90.0%得分成为第一个在MMLU(大规模多任务语言理解)测试中超过人类的模型。记者了解到,MMLU是一个结合了数学、物理、历史、法律、医学和伦理学等57个科目的测试集,用于测试世界知识和解决问题的能力。相比于其他测试集,MMLU的广泛性和深度更强,特别是测试大模型在复杂和多变的真实世界场景中的表现。
  “Gemini是我们强大的模型。通过吸收大量的信息,它可以理解我们四周的环境,理解我们的思维方式,并有所产出。”谷歌DeepMind执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)介绍说。
  同时,他也正面谈及Gemini与GPT-4的对比。“我们运行了32个完善的基准测试来比较Gemini和GPT-4,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。我认为我们在32项基准中的30项中大幅领先。”哈萨比斯说。
  在Gemini发布之前,谷歌在生成式AI和LLM方面主推的两款模型PaLM 2和LaMDA,在用户当中收获的评价一直不高,相对于业界领军的GPT-4差距很大。Gemini的发布,标志着谷歌迈进新纪元的开始。
  目前,Gemini Pro和Gemini Nano可开始应用于在聊天机器人Bard和智能手机Pixel 8 Pro中,并将很快与谷歌服务中的其他产品集成,包括Chrome、搜索和广告等。强大的Gemini Ultra则将在明年发布。
关键词:谷歌Gemini

全年征稿 / 资讯合作

稿件以电子文档的形式交稿,欢迎大家砸稿过来哦!

联系邮箱:3342987809@qq.com

版权与免责声明

凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。

本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

热点排行

广告