欧宝平台中国AI显自信阿里向世界开源最准确语音识别模型
马斯克旗下xAI发布创新模型Grok-1.5V 实现流程图到Python代码的转换
OpenAI全球推介会:阿尔特曼保证ChatGPT升级不涉API用户数据
华为哈勃首投国内AI大模型企业:面壁智能获数亿元融资,知乎CTO李大海掌舵
ChatGPT重大更新!新版GPT-4 Turbo,颠覆你的智能想象!
近日,阿里巴巴达摩院机器智能实验室语音识别团队,推出了新一代语音识别模型DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。该团队同时宣布,即日起向全世界企业与个人开源DFSMN模型,使全球开发者都能共享这一成果,全球语音识别准确率也有望总体提高10%。语音识别是人机交互中的核心技术,在智能音响、智能家居、自动驾驶等领域都有广泛应用。
近日,阿里巴巴达摩院机器智能实验室语音识别团队,推出了新一代语音识别模型DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提高至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)欧宝平台。
这支平均年龄只有30岁的团队还宣布,即日起向全世界企业与个人开源此次打破全球语音识别纪录的DFSMN模型,使全球开发者都能共享这一成果,共同推进人工智能技术的发展。这也使DFSMN有望继传统的LSTM模型后,成为全球语音识别领域最主要的声学识别模型之一,全球语音识别准确率也有望总体提高10%。
著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”
图片说明:阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型
语音识别是人机交互中的核心技术,在智能音响、智能家居、机器人及自动驾驶等领域都有广泛应用。在刚刚结束的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。
DFSMN语音识别模型,对比目前业界使用最为广泛的LSTM模型,训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。
【ITBEAR科技资讯】4月13日消息,亚马逊全球机器人、机电一体化和可持续包装总监斯特凡诺・拉罗韦雷近日在接受CNBC的“Street Signs Europe”节目采访时,明确阐述了亚马逊在机器人和自动化技术方面的立场。拉罗韦雷表示,这些技术并不会取代人类的工作,反而会提升人们
马斯克旗下xAI发布创新模型Grok-1.5V 实现流程图到Python代码的转换
【ITBEAR科技资讯】4月13日消息,马斯克旗下的人工智能公司xAI继3月下旬推出Grok-1.5大语言模型后,于近日再度发布其首个多模态模型Grok-1.5 Vision(简称Grok-1.5V)。xAI计划近期邀请早期测试者及现有的Grok用户参与Grok-1.5V的测试。新模型不仅增强了文本理解能力,更
OpenAI全球推介会:阿尔特曼保证ChatGPT升级不涉API用户数据
【ITBEAR科技资讯】4月13日消息,近日,人工智能领域的领头羊OpenAI在全球范围内举办了一系列推介会。公司首席执行官山姆・阿尔特曼(Sam Altman)亲临旧金山、纽约和伦敦,向众多“财富500强”企业的高层管理者发表了演讲。在这些活动中,阿尔特曼明确承诺,OpenAI将不会
【ITBEAR科技资讯】4月13日消息,360公司近日在GitHub上公开了其360智脑7B(70亿参数模型)欧宝平台,这一大模型是基于3.4万亿Tokens的语料库进行训练的,主要涵盖了中文、英文和代码。该模型提供了4K、32K、360K三种不同的文本长度选项,其中360K(大约50万字)被360自称为当前国内
欧宝平台
华为哈勃首投国内AI大模型企业:面壁智能获数亿元融资,知乎CTO李大海掌舵
【ITBEAR科技资讯】4月12日消息,北京面壁智能科技有限责任公司昨日成功完成了新一轮数亿元的融资,由春华创投和华为哈勃领投,北京市人工智能产业投资基金等跟投,同时知乎作为战略股东也持续跟投支持。这一轮融资的完成,无疑为面壁智能在人工智能大模型领域的发展注
【ITBEAR科技资讯】4月12日消息,三星的Galaxy AI营销策略取得了显著的成功。最新研究报告显示,高达25%的Galaxy S24系列手机消费者因为看重这些AI功能而选择了这款手机。根据市场调查机构Worldpanel ComTech于2024年2月进行的一项跨国调查,涉及法国、德国、英国、意大
【ITBEAR科技资讯】4月12日消息,近日,Github前首席执行官Nat Friedman在社交媒体平台X上发帖,透露了谷歌最新AI聊天工具Gemini的流量数据。据Friedman称,Gemini的流量已经达到了ChatGPT的25%左右,这一显著成绩是在谷歌并未借助其庞大的分销渠道(如Android、Google搜
【ITBEAR科技资讯】4月12日消息,据内部消息人士披露,全球人工智能领军企业OpenAI的CEO山姆·奥特曼(Sam Altman)正积极推进一个宏大的计划,意在构建一个集结了全球各国政府和业界巨头的联盟。这个联盟的核心目标是确保人工智能技术发展所必需的芯片、能源以及数据中心
【ITBEAR科技资讯】4月12日消息,近日,百度公司创始人李彦宏在内部讲话中阐述了百度决定不对其人工智能模型文心一言进行开源的原因。在目前国内推出开源模型的公司并不多的情况下,百度的这一决策引起了业界的广泛关注。李彦宏解释了百度选择不开源模型的几个主要原因
ChatGPT重大更新!新版GPT-4 Turbo,颠覆你的智能想象!
【ITBEAR科技资讯】4月12日消息,OpenAI官方今日宣布,新版GPT-4 Turbo已开始向所有付费ChatGPT用户开放。此次更新在写作、数学、逻辑推理和编码等多个方面均带来了显著的提升。据ITBEAR科技资讯了解,GPT-4 Turbo的更新旨在提升用户体验,特别是在响应速度和交流直接性
【ITBEAR科技资讯】4月12日消息,近期,一款名为Kimi的智能助手在国内AI领域掀起了热潮。其背后的创业公司月之暗面凭借Kimi的“200万字长文本”能力率先出圈,甚至催生了“Kimi概念股”。然而,随着阿里、百度等大厂的跟进,这场长文本推理能力的竞争日趋激烈。Kimi的走
【ITBEAR科技资讯】4月12日消息,OpenAI今日声明,已向付费的ChatGPT用户推出了全新的GPT-4 Turbo。相较于1月份推出的版本,GPT-4 Turbo在写作、数学运算、逻辑推理及编码方面的能力均有所提升。目前,GPT-4 Turbo可适用于ChatGPT Plus、Team、Enterprise及API等多个平
【ITBEAR科技资讯】4月11日消息,近日,一份由在线营销企业Authority Hacker进行的两千人样本调查显示,近八成的受访美国公民希望对人工智能实施更为严格的法律监管措施,尽管这可能会对人工智能技术的创新速度产生一定影响。随着人工智能技术的飞速发展,虽然为人类生
【ITBEAR科技资讯】4月11日消息,苹果公司于4月8日发布了一款名为Ferret-UI的新型多模态大语言模型,该模型能够有效理解和与屏幕信息进行交互,并在所有基本UI任务上超越了GPT-4V。这一技术的发布,让人们对未来智能交互的期待愈发高涨。据ITBEAR科技资讯了解,Ferret-U
【ITBEAR科技资讯】4月11日消息,蚂蚁集团自主研发的智能研发平台CodeFuse近期推出了一项名为“图生代码”的新功能,该功能允许开发人员利用产品设计图一键生成代码,从而显著提升前端页面的开发效率。目前,该功能正处于内测阶段。CodeFuse作为蚂蚁集团内部推行AI编程
全球首款!华硕8K Mini LED显示器ProArt Display PA32KCX即将发布
飞米FIMI MINI 3无人机4 月 15 日发布:多彩机身,三轴云台稳定拍摄
谷歌AI应用 Google Vids亮相:PPT技能通用,视频制作与多人协作一站式搞定
特斯拉加速推进人形机器人项目,招聘技术撰写员预示Optimus即将面世
ChatGPT重大更新!新版GPT-4 Turbo,颠覆你的智能想象!
本网站LOGO小熊标志受版权保护,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR官方许可,严禁使用。