【[67星]VITA-Audio：一款高效的语音语言模型，能够快速生成音频和文本

爱生活爱珂珂 2025-05-08 20:56:51

【[67星]VITA-Audio：一款高效的语音语言模型，能够快速生成音频和文本内容。亮点：1. 低延迟，首次音频生成时间从236毫秒缩短到53毫秒；2. 推理速度提升3-5倍；3. 开源数据训练，包含20万小时音频】

'VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model'

GitHub: github.com/VITA-MLLM/VITA-Audio

语音生成语言模型开源数据 AI创造营

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【[597星]S4_Slicer：一款通用非平面切片工具，让你几乎无需支撑即可打

2

【[294星]ContextGem：让从文档中提取结构化数据变得轻而易举的LLM

3

【[109星]Parakeet MLX：为苹果芯片优化的Nvidia语音识别利器

4

【[69星]Agentica-project/verl-pipeline：为大规

5

【[2.7k星]astral-sh/ty：一个用Rust编写的超快速Python

6

【[192星]PyRoki：一个为机器人运动优化而生的Python工具包。亮点：

7

【[307星]Toolkami：仅用七个工具实现的极简AI Agent框架，轻松

8

【[113星]AgibotTech/genie_sim：为机器人AI开发提供高效

9

【[615星]Brush：用Rust实现的bash/POSIX兼容Shell，让

10

【[67星]VITA-Audio：一款高效的语音语言模型，能够快速生成音频和文本

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

说刘强东作秀的，你们让王兴也秀一个噻，或者你们自己做一天体验一下。一个千亿身价的

2

目前接近完美的6部手机，有你在用的嘛？

3

曝iPhone19Pro外形颠覆现在就已经预测了，2027年的iPhone1

4

这么老的苹果还在用

5

上强度了！某些APP装傻充愣，就是不兼容鸿蒙系统，死抱着安卓。工信部看不过眼了，

6

国外拆解Mate30，零部件国产率仅为30%，国外拆解Mate30 5G，零部

7

手机续航排行榜！便宜手机电池越来越大，这是什么套路？手机

8

格力电器董明珠董事长的“海归论”，遭到一些人的批评和质疑，个人觉得大可不必。

9

刚刚！#一加13T#首销10分钟破两亿！这手机我也用了几天，最大的感受是真爽，单

10

预算2000元适合买什么手机？这次机型供参考，性价比和当年小米1999不相上下。

科技最新文章

1

今年5月将推出鸿蒙电脑，以下是一些与鸿蒙电脑相关的上市公司及概念股：（内容来自网

2

惊呆了！英伟达突然宣布！宁愿冒着亏损55亿美元的风险，也要和我们做抵抗

3

目前接近完美的6部手机，有你在用的嘛？

4

整个行业给雷军陪葬了。交通部新规刚落地三天，华为直接掀了桌子。央视直播镜

5

万万没想到荣耀手机竟然能免费换电池，你知道吗荣耀手机的专属福利，荣耀电量宝从

6

千万别被荣耀“忽悠”了这哪里只是一台8000mAh超长续航的机型，实际用了半个

7

国外拆解Mate30，零部件国产率仅为30%，国外拆解Mate30 5G，零部

8

五一假期，登山爬楼神器外骨骼机器人火了！外骨骼机器人概念梳理：最近，程天科技在购

9

同学的折叠屏手机屏幕摔坏了，问了售后维修价格是4000多，后来感觉不划算，直接把

10

华为第一个季度的销量，有多恐怖，不调查不知道，一调查吓所有人一大跳，大家可能都知