Gemini 1.5 Pro谷歌希望超越ChatGPT的5项功能

发布时间:2024-03-11 16:27:34 栏目:综合问答

    导读 距离谷歌推出强大的AI模型Gemini1.5 Pro还不到一周的时间。该模型目前可供部分用户使用,并且已经在互联网上引起了一些关注。Gemini 1.5...

    距离谷歌推出强大的AI模型Gemini1.5 Pro还不到一周的时间。该模型目前可供部分用户使用,并且已经在互联网上引起了一些关注。Gemini 1.5 Pro 中型多模式 AI 模型已针对广泛的任务进行了扩展。该模型配备了标准的 1,28,000 个令牌上下文窗口,但是,Google 允许有限数量的开发人员和企业客户尝试使用最多 100 万个令牌的上下文窗口。

    虽然Gemini 1.5 Pro 距离向公众开放还很遥远,但互联网上似乎充斥着那些已经访问过该型号的人分享的令人难以置信的用例。以下是一些使 Gemini 1.5 Pro 模型在人工智能模型和聊天机器人的海洋中引人注目的用例。

    我们正处于人工智能时代,美好得令人难以置信的文本、图像和视频会让我们产生怀疑。虽然有迹象表明图像或视频是否是人工智能生成的,但迄今为止还没有任何人工智能工具可以评论视频的来源或准确性。上传最近发布的 Sora 猫视频,询问 Gemini 1.5 Pro 是否由 AI 生成,会给你一个答案,可以消除你的疑虑。1.5 Pro 立即表示上传的视频可能是 AI 生成的,但很难确认。人工智能表示,猫的动作和逼真的灯光阴影可以表明它是真实的。然而,与此同时,猫的眼睛显得不自然地大,皮毛看起来也过于完美。回复中并没有明确说明此事,但Gemini 1.5 Pro却说得很详细,哄用户自己决定。

    谷歌在 Gemini 1.5 Pro 推出时就证明了这一点,开发人员展示了如何使用 44 分钟长的无声电影作为提示。后来他们使用多模态提示来查看模型的准确性。同样,在上传整个NBA扣篮大赛的长视频,询问哪一个扣篮核心最高。Gemini 1.5 Pro 模型能够准确地找到完美的 50 次扣篮,并基于其理解长上下文视频的能力的细节。

    分析成绩单并帮助您做出决定

    想象一下,您对两部杰作之间该看哪部电影感到困惑。人们的本能反应是上网查看收视率并做出决定。使用 Gemini 1.5 Pro,您可以根据电影脚本的分析获得更多个性化信息。用户可以上传两部电影的文字记录,并要求 Gemini 对文字记录进行比较和对比。谷歌人工智能模型能够根据脚本对两部电影进行精确比较。

    这可能会改变游戏规则,因为 Gemini 1.5 Pro 可以在几分钟内翻译语言。它甚至可以将整个新闻通讯从英语翻译成萨特兰语(Saterlandic)等只有不到 2000 人使用的语言。虽然 ChatGPT 或 Gemini Chatbot 的免费版本取得了一定的成功,但 Gemini 1.5 Pro 可能是一个很好的翻译工具。

    解码文档中的复杂表格

    Gemini 1.5 Pro 可能成为许多专业人士的救星。该模型甚至能够破译 PDF 文件中长报告中最复杂的表格和统计数据。为了简化,上传一份150页长的报告作为报告,并要求模型解释第77页的表格。秒秒的人工智能模型给出了最合乎逻辑的解释。

    Gemini 1.5 Pro 配备了标准的 1,28,000 令牌上下文窗口。然而,谷歌允许一组选定的开发人员和企业客户在最多 100 万个代币的上下文窗口中进行尝试。Gemini 1.5 Pro 目前处于预览模式,开发者可以使用 Google 的 AI Studio 和 Vertex AI 来测试该模型。

免责声明:本文由用户上传,如有侵权请联系删除!