全球首个孕育机器人或一年内问世,引发伦理与技术思考
全球首个孕育机器人预计一年内面世,定价不超10万。该技术模拟子宫环境,为特定群体提供生育可能,有积极社会意义。但在技术、伦理和法律层面存在诸多问题,需严···
2025-08-11
当地时间周四(8月7日),全球科技界迎来一件大事。OpenAI官方正式推出了备受外界期待的新一代人工智能模型GPT - 5。这一发布,无疑是人工智能领域的一次重大飞跃。
OpenAI在新闻稿中强调,GPT - 5的智能性能远超公司之前的所有模型。它在编码、数学、写作、健康、视觉感知等众多领域均拥有卓越的性能。而且,GPT - 5是一个统一的系统。它能够识别何时快速响应,何时需要更长时间的思考以提供专家级的应答。用户无需手动选择使用常规语言模型还是推理系统,GPT - 5会自动判断。
OpenAI表示,GPT - 5将面向所有用户开放。Plus会员可获得更多使用量,Pro会员则可访问GPT - 5 Pro版本。该版本具有扩展推理能力,能提供更全面、更准确的答案。
先前,OpenAI首席执行官萨姆·奥尔特曼称GPT - 5是一次“重大升级”。他说“这还是第一次,真的像是在与某个领域的专家对话”。ChatGPT团队负责人Nick Turley也表示,新模型在响应速度、回答准确性以及减少“幻觉”方面都优于前代产品。与它对话,感觉自然了不少。
在8月7日的简报会上,奥尔特曼对GPT - 5给予了极高评价。他将GPT - 5定位为通往AGI的重要里程碑。他甚至不惜用“踩”GPT - 4来抬高GPT - 5,称尝试用回GPT - 4效果相当糟糕。
作为OpenAI的“最强大模型”,GPT - 5在三个关键领域实现了显著提升。
首先是编程能力。GPT - 5是OpenAI迄今为止最强大的编码模型。在复杂的前端生成和大型代码库调试方面,它表现突出。仅需一个提示,它就能创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面有改进。
在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中,GPT - 5思考后首次尝试的准确率达74.9%。这高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。评论指出,这意味着GPT - 5的表现略胜于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。
奥尔特曼称,GPT - 5尤其擅长按需启动整个软件App,即“氛围编码”。它能用AI根据自然语言提示生成功能代码,从而加快开发速度。OpenAI的研究者做了演示,要求GPT - 5创建一款网页App,帮助说英语的用户学习法语。该App要有引人入胜的主题,包含抽认卡、测验、经典的贪吃蛇游戏,以及追踪每日学习进度的方法。研究者将相同提示词提交到两个GPT - 5窗口中,几分钟后就生成了两个不同的App。虽然这些App“存在一些缺陷”,但用户可根据个人喜好再调整。
在创意写作方面,GPT - 5表现出色。它能够处理结构复杂的写作任务,如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT - 5在创意任务上表现出“更好的品味”,响应更自然。
健康咨询是第三个重要提升领域。GPT - 5能更积极地标记潜在健康问题,帮助用户解析医疗结果。不过,OpenAI强调,ChatGPT不能替代医疗专业人员。在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%。这远低于GPT - 4o和o3模型。
OpenAI称,GPT - 5相比此前的模型更可靠和实用。它能更准确地回答现实世界的疑问,出现幻觉的可能性显著降低。在对代表ChatGPT生产流量的匿名提示词启用网络搜索后,GPT - 5响应中包含事实错误的可能性比GPT - 4o低约45%;思考后,GPT - 5响应中包含事实错误的可能性比o3低约80%。
此外,OpenAI还为GPT - 5引入了一种新的安全训练形式,名为安全补全。它教模型在安全范围内尽可能给出最有帮助的答案。如果需要拒绝,经过训练的GPT - 5会以透明的方式告知用户拒绝的原因,并提供安全的替代方案。
OpenAI称,GPT - 5在指令执行方面表现提升,其执行自定义指令的能力也得到了相应的提升。OpenAI将为所有ChatGPT用户推出四种预设性格的全新研究预览版。初始的四种性格选项——愤世嫉俗者、机器人、倾听者和书呆子都是可选的,用户可在设置中随时调整,用以匹配ChatGPT和用户的沟通风格。
值得一提的是,微软在GPT - 5发布当日即宣布,将其整合到广泛的产品线中。在企业级应用方面,Microsoft 365 Copilot将利用GPT - 5更好地处理复杂问题、在长对话中保持专注并理解用户上下文。企业用户可通过推理功能处理电子邮件、文档和文件。对于消费者,Microsoft Copilot的新智能模式将利用GPT - 5帮助用户发现最佳解决方案。用户可通过copilot.microsoft.com或Windows、Mac、Android和iOS设备上的Copilot应用免费体验GPT - 5。开发者将通过GitHub Copilot和Visual Studio Code获得GPT - 5支持,用于编写、测试和部署代码。Azure AI Foundry平台将提供所有GPT - 5模型,配备AI驱动的模型路由器,根据每个任务的复杂性、性能需求和成本效率选择最优模型。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至admin@pbootcms.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
全球首个孕育机器人预计一年内面世,定价不超10万。该技术模拟子宫环境,为特定群体提供生育可能,有积极社会意义。但在技术、伦理和法律层面存在诸多问题,需严···
2025-08-11
当地时间8月7日,OpenAI推出GPT - 5。它智能性能远超以往,在编码、写作、健康等领域显著提升。Plus和Pro会员有更多权益,微软抢先接入。GPT - 5编程强、写作似诗···
2025-08-08
近期,脱口秀节目让‘转人工难’话题爆火。如今,AI客服虽有高效等优势,但转人工流程复杂,AI还常听不懂诉求。企业出于成本考量减少人工客服,可AI也有诸多弊端···
2025-08-01
2025世界人工智能大会7月26 - 28日在上海多地举办。本次以“智能时代 同球共济”为主题,展览面积首破7万平,800余家企业参展,3000余项前沿展品亮相。30余国家和···
2025-07-26
7月苹果推出iOS 26公测版,这是重大系统升级。它采用“液态玻璃”设计,带来界面革新,应用全面升级,还加入大量AI元素。不过,iPhone XS等三款老机型无法升级。···
2025-07-25
最新资讯
全球首个孕育机器人或一年内问世,引发伦理与技术思考
重磅!OpenAI发布GPT - 5,多领域展现卓越实力
AI客服崛起,转人工为何难如西天取经?
2025世界人工智能大会:开启智能新时代
苹果iOS 26公测版发布:液态玻璃设计与AI功能双升级
上海街头真无人出租车来袭,开启未来出行新体验
全国首次!翼龙应急型无人机实现台风全链条应急侦察
上海街头无人出租车来袭,智能出行新体验
软件服务故障致“星链”网络中断2.5小时
19岁大一学生凭技能斩获国企offer,他的成功秘诀是什么?