。这家科技巨头已经让一些选定的公司提前获得 Gemini 的早期版本,该版本旨在与 OpenAI 的 GPT-4模型竞争。
据悉,Gemini 由一系列大型语言模型组成,为一系列应用程序提供支持,包括聊天机器人、文本摘要、生成电子邮件草稿和新闻报道等原始文本,以及帮助软件工程师编写代码和生成图像。
谷歌今年加大了对生成式人工智能的投资,Gemini 是其追赶 OpenAI 战略的关键组成部分。该公司计划通过其 Google Cloud Vertex AI 服务向公司可以提供 Gemini。
上个月,谷歌在印度和日本的搜索工具中引入了生成式人工智能,允许用户根据提示接收文本或视觉结果。该公司还向企业客户提供人工智能驱动的工具,每月价格为每用户30美元。
Gemini 的推出对于谷歌来说意义重大,因为它旨在将自己打造成对话式AI领域的竞争对手。该软件有潜力通过实现机器与人类之间更复杂、更高效的通信来彻底改变各个行业。然而,Gemini 在与 OpenAI 流行的 ChatGPT 模型的对抗中表现如何,还有待观察。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!
AMD宣布签署协议收购开源人工智能软件公司Nod.ai,以扩展公司的开源AI软件能力。Nod.ai的加入将为AMD带来一个经验比较丰富的团队,该团队开发了领先行业的软件技术,可加速部署针对AMDInstinct™数据中心加速器、Ryzen™AI处理器、EPYC™处理器、Versal™SoC和Radeon™GPU来优化的AI解决方案。Nod.ai的SHARK软件基于编译器的自动化能力减少了对手动优化的需求,缩短了部署高性能AI模型在AMDCDNA™、XDNA™、RDNA™和“Zen”架构的数据中心、边缘和客户平台上运行所需的时间。
据TheInformation报道,知情的人偷偷表示,鉴于谷歌上周开始向部分企业测试其多模态大模型Gemini,OpenAI希望抢占先机,推出自己的多模态AI系统。OpenAI在3月份推出语言模型GPT-4时曾预览了多模态功能,但至今仅向为盲人提供服务的BeMyEyes公司开放。AI领域两大巨头互相竞争有利于行业技术进步,消费者也将从中受益。
谷歌即将发布Gemini,这是一种多模态语言模型,可能会挑战OpenAI的GPT-4的领导地位。但据报道OpenAI正在准备做出适当的回应,该公司计划通过引入名为“GPT-Vision”的图像理解功能来应对Gemini的竞争。Gobi的训练还没有开始,有机会成为GPT-5。
AMD周二宣布计划收购人工智能初创公司Nod.ai,以加强其软件能力。这是为了赶超竞争对手芯片制造商英伟达。当被问及公司是不是计划通过额外的收购来增强其投资组合时,Peng表示:「我们从始至终在寻找交易对象。
Auctoria是一家在游戏行业引领创新的初创公司,它利用先进的人工智能彻底改变了3D视频游戏资产的创建方式。这一突破是在创始人AleksanderCaban意识到手动设计视频游戏环境的基本元素既耗时又费力之后取得的。随着Auctoria的持续不断的发展,它有潜力重塑视频游戏开发的格局。
ChatGPT背后的OpenAI公司,正在考虑制造自己的人工智能芯片,并已评估潜在的收购目标。根据最近的内部讨论,公司尚未决定是不是继续前进。英伟达是少数几家生产有用的人工智能芯片并主导市场的芯片制造商之一。
一份来自专业服务企业KPMG的新报告揭示了高级管理人员对工作场所生成式人工智能的立场。72%的美国CEO确认将在其业务中部署生成式AI,即使面临宏观经济挑战,也将视为“顶级投资重点”。但报告说明,入门级角色和客户服务工作面临AI替代的风险最高,女性是受影响最大的人群。
GoogleCloud周一宣布了新的人工智能驱动搜索功能,据称将帮助医护工作者快速从不一样的医疗记录中获取准确的临床信息。医疗行业拥有大量有价值的信息和数据,但由于通常存储在多个系统和格式中,因此对于临床医生来说,找到这一些信息可能会很具有挑战性。」「现在,我们已到了一个AI在这些非常实际的用例中起到一定的帮助的地步。
微软于上周发布了其BingImageCreator的新版本,这是一个由OpenAI的新模型DALL-E3提供支持的AI图像生成工具。它旨在提供比之前的图像生成AI模型更强大的功能,包括比以前更丰富地理解复杂用户请求的能力。倘若幸运的话,也许它还能提升我们讨论的基调。
人工智能可能正在引发对人们工作保障的担忧,但新一波工作岗位正在涌现,这些岗位专注于审核下一代人工智能模型的输入和输出。自2022年11月以来,全球的商业领袖、职员和学者都一直担心生成式AI将扰乱大量专业岗位。」他还表示:「中小企业可以将注意力从单调的文件分析转移到批准由AI模型生成的输出,并通过应用来自人类反馈的强化学习进一步改善这些输出。
Speech To Text - AI是一个在线工具,能够将用户上传的音频文件或者YouTube视频链接转换为文本。这款应用使用先进的AI技术来识别和转录音频内容,使得用户能快速方便地从音频中获得文本信息。
Coloromo是一个艺术生成器,可以将您的照片转化成各种艺术风格的作品,无需设计技能。用户只需上传照片,进而选择喜欢的艺术风格,便可免费下载或购买打印作品。Coloromo能够为个人用户创造个性化艺术作品,也能为商业用户更好的提供高分辨率广告素材,增强数字内容的质感。同时,Coloromo也可以合作艺术家将其作品转化成更多艺术品种类。
多墨智能写作是一款由AI强力驱动的创意写作工具,帮助职场人提升工作交付效率。它独家支持根据不同岗位通过算法一键生成工作文档,适合各种职业需求,包括产品经理、抖音运营专员、战略咨询专家、老师、医生、公职人员、旅游导游、公关等。多墨智能写作提供一键成文、辅助撰写、命令自定义和私有化部署等功能,可定制解决方案并保护内部数据隐私。
Vista-LLaMA是一种先进的视频语言模型,旨在改善视频理解。它通过保持视觉令牌与语言令牌之间的一致距离,无论生成文本的长度如何,都能减少与视频内容无关的文本产生。这种方法在计算视觉与文本令牌之间的注意力权重时省略了相对位置编码,使视觉令牌在文本生成过程中的影响更为显著。Vista-LLaMA还引入了一个顺序视觉投影器,能够将当前视频帧投影到语言空间的令牌中,捕捉视频内的时间关系,同时减少了对视觉令牌的需求。在多个开放式视频问答基准测试中,该模型的表现显著优于其他方法。
GenSAM是一种针对迷彩对象检测(COD)的方法,它使用Cross-modal Chains of Thought Prompting (CCTP)技术来理解视觉提示,并利用通用文本提示来获取可靠的视觉提示。该方法通过渐进式掩膜生成(PMG)在测试时自动生成并优化视觉提示,无需额外训练,实现高效准确的迷彩目标分割。
Chronicle是一个全新的故事创作工具,通过精心设计的模块化Blocks,让用户都能够轻松地创建具有完美设计、互动性和动态效果的故事。用户都能够定制Blocks、嵌入链接、以键盘为主的工作流程,并与团队实时协作,还能够最终靠专家认证的模板快速启动创作。
FutureFinder是一款AI驱动的个人教育顾问,能为您提供学校/大学和职业选择方面的智能、个性化建议。通过易于理解的推荐和有用的资源,帮助您找到最对自己最合适的道路。使用GPT-4技术,它能做全面评估并提供定制结果,还能评估您的大学申请,提供科学建议并进行模拟面试。不仅如此,它还提供个性化的学府和职业道路建议,并在申请过程中提供详细的支持。适用于高中生、大学生和职场人士,帮他们在教育和职业方面做出明智的决定。
Invoice Reader Application是一个移动APP发票扫描应用。它使用光学字符识别技术,可以自动识别和提取发票上的关键信息,比如发票号码、日期、供应商与金额等,大大简化了账务处理工作。该应用支持识别多种语言的发票,覆盖全球主要市场。它可以将识别结果直接导入excel等软件,也可以连接到会计系统,实现自动记账。该应用使用简洁的界面,操作十分便捷,能够迅速提升公司和个人的发票处理效率。
MathPile是一个包含约95亿个标记的数学中心语料库,从教科书(包括讲座笔记)、arXiv、、ProofWiki、StackExchange和网页中汲取数学内容,适用于K-12、大学、研究生水平和数学竞赛。MathPile的数据质量高,并且有着丰富的数据文档,以增强透明度和给用户灵活的使用数据的能力。在授权方面,MathPile遵循BY-NC-SA 4.0许可协议,同时计划很快发布一个商业可用版本。
Rationale是一种革命性的AI,能够在一定程度上帮助企业主、经理和个人做出艰难的决定。通过考虑所有相关因素和背景,Rationale可帮助您做出理性的决定。它具有人工智能决策工具的四种技术,包括决策分析技术、上下文分析、可定制的音调和多种语言支持。Rationale提供三种定价选择,分别是Lite、Standard和Max,价格在$9.99到$99.99不等。
Zeta是一个开源项目,提供模块化、高性能和可扩展的构建块来快速构建AI模型。它包括多种功能,如Flash Attention、SwiGLU、相对位置偏差、前馈网络、BitLinear变换、PalmE多模态模型、U-Net、视觉嵌入和其他多种高级特性。
DeepFashion 是一个 AI 时尚创新平台,通过训练品牌 AI 模型,为用户生成与其个性风格相符的时尚造型。用户只需上传 5 张图片并进行 10 分钟的训练,AI 助手每天就能生成 17280 张高分辨率 4K 时尚 LOOK 图像,完美体现用户的个性特点。这个创新且高效的工具将提升您的时尚体验。
米啫喱是一款可以通过AI智能技术进行绘画创作的工具。它能够迅速生成各种各样图画,提供多种样式和艺术性选择。用户都能够上传参考图作为创作参考,还能够准确的通过个人喜好调整细节丰富度和文本偏离值等参数。开通会员后,用户将享受无限制的创作权限。米啫喱是设计师、艺术家和创作者的理想选择。
自动检测平台是一个省心、专业的论文生成工具。它提供了自动生成论文范文的功能,用户只要输入论文标题即可得到范文,同时还包括论文的自动检验测试和查重报告。用户都能够选择不同的学历和模型,生成符合标准要求的论文。自动检验测试平台可以帮助用户节省写论文的时间,提供高质量的范文,方便用户进行学术研究和写作。
ASKWay利用ChatGPT和GPT-4,提供创新的AI聊天和助手体验。用户都能够创建独特的AI聊天机器人伙伴,定制外观,培养个性,分享情感,减轻焦虑,与之一同成长。该应用提供沉浸式AI体验和AI时间创意工作坊,鼓励用户进行艺术表达、技术实践和跨学科合作。
笔杆论文写作是一款专业的写论文平台,提供内容生成、素材推荐、修改润色、论文查重、审核校对、智能降重、多语言翻译等全流程写论文工具。它通过数十亿学术文献为 AI 赋能,实现自主创作,快速高效,保证原创度。同时,提供沉浸式论文写作、写作模板、智能提纲推荐、写作思路推荐、论文查重等丰富的论文服务,满足写论文当中的所有需求。
歌者PPT是一款可以帮助用户生成高质量PPT的工具。用户只需输入标题,AI就能够准确的通过用户的需求帮助完成PPT的创作,节约用户构思和美化时间。歌者PPT提供多种模式轻松输入,能适应不同的使用场景,同时也提供丰富的模板和工具供用户自由编辑。用户还可以一键分享或下载PPT文件。歌者PPT定位于节省用户时间,提供高质量的PPT创作服务。
茅茅虫是一站式论文在线写作平台,提供论文写作助手、论文开题、论文答辩、论文查重等功能。通过人工智能技术,帮助用户提升写作能力,提供论文灵感、生成论文提纲、降重、查重等服务。
Otto SEO是一个利用人工智能技术进行SEO优化的在线平台。它结合了数十年的SEO专业相关知识以及最先进的AI模型,简化了SEO内容生成、技术优化等复杂流程。用户都能够为不同的品牌定制语音,生成针对品牌个性化的独特优化内容。平台内容通过检验测试 Basically Human 得到99%以上符合人类原创的结果。支持无限量WordPress集成、Zapier等第三方工具连接,以及内容排期发布等功能。Otto SEO的目标是完全取代传统数字营销代理机构,以更高效、低成本的方式使用户得到满足的SEO需求。