阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime，支持情绪感知与人设自定义

2026-07-16 10:03:38 休闲

阶跃星辰昨晚发布了新一代实时语音大模型StepAudio 2.5 Realtime，阶跃目前已全量上线，星辰新代型开发者可通过阶跃星辰开放平台接入使用。发布

该模型定位于打造更具“活人感”的语音义AI对话体验，重点围绕副语言感知、大模人设自定义与对话能力三个方向进行技术升级。支持自定

IT之家从官方获悉，情绪StepAudio 2.5 Realtime 的感知核心突破在于其对“副语言”信息的处理能力。所谓副语言，人设指的阶跃是语调、语速、星辰新代型停顿乃至一声叹息或轻笑等文字以外的发布表达方式，这些细节恰恰是语音义人类情感传递的主要载体。模型通过对这些元素的大模解读，可以感知对话者的支持自定情绪状态与潜在意图，比如从低沉的声线中察觉疲惫，或是从急促的语气里识别出烦躁情绪，并据此动态调整回应的语气与策略，旨在降低交互的生硬感，使其更像与真人交谈。

在人设灵活性方面，StepAudio 2.5 Realtime 将定义权完全交给用户。开发者可以通过 API，从性格特质、背景经历、个人好恶到语言习惯与对话边界，对 AI 角色进行精细化调节。这一能力的背后，是模型基于超过 10,000 个高质量原生人设，通过算法裂变生成的百万级人设特征矩阵，并结合海量真实场景对话语料训练而来。针对深度角色扮演中常见的“人设崩塌”痛点，开发团队进行了专门的 RLHF（基于人类反馈的强化学习）对齐优化。据官方介绍，即使在极端情境的压力测试下，模型依然能保持高度稳定、可信的角色一致性。同时，该模型也内置了 5 个预设人设供用户直接选择体验。

在整体对话能力上，该模型强调智商与情商的双重跃升。除了深度理解复杂语义、应对抛梗接梗等交流场景，模型还能灵活调用多领域知识以提供更深度的对话体验，在应用中既可扮演提供情绪价值的聊天搭子，也能模拟专业 HR 进行面试等严肃场景。

根据官方发布的2026年4月评测数据，该模型在五个测试维度中均位列第一。其中最能反映真实体验的主观评测（手机App真人对话打分）得分80.41，高于GPT-Realtime-1.5的68.01和Gemini Live的67.16；语音问答基准得分为79.80，约为GPT-Realtime-1.5的1.5倍。

本文源自：IT之家

阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime，支持情绪感知与人设自定义

最近关注

伦敦世乒赛丨中国女乒险胜日本队第24次捧起考比伦杯

2026年“山西精品”品牌日主题活动在太原市举行

广州新一轮降雨时间确定！

《公安部关于修改〈道路交通事故处理程序规定〉的决定（征求意见稿）》公开征求意见

激情与温情相遇绿茵场 “川超”决赛阶段开启下半程争夺

友情链接

“四大名锦”时尚大秀是生动的美育课，让孩子读懂国风匠心

鹤城各社区花式“宠妈”

天舟十号各系统做好发射前准备工作，发射窗口天气满足发射条件

美媒：“加勒比公主”号邮轮暴发诺如病毒疫情，已有115人出现腹泻呕吐等症状

英国地方选举执政党工党溃败，首相斯塔默拒绝辞职

普京：铭记卫国战争真实历史是俄罗斯人的荣耀

普京：铭记卫国战争真实历史是俄罗斯人的荣耀

浏阳烟花厂爆炸事故4名重症患者已转为轻症

四川宜宾人员关联境外邮轮疫情？当地疾控中心：陈某于3月31日下船，与首例病例无时空交集，其下船至今39天，汉坦病毒核酸检测为阴性

连年战火货币贬值黎巴嫩约124万人面临粮食危机