中新网9月19日电 9月17日,2018世界人工智能大会在上海召开。本次大会以“国际化、高端化、专业化、市场化”为特色,集聚了全球人工智能领域最具影响力的科学家和企业家。大会以“城市智脑、智能核芯、创新算法”为AI精品展的主题,来自谷歌、微软、腾讯、搜狗等数十家国际公司通过AI产品,向参会者展示出它们的“中国方案”和“世界智慧”。
一直以来,搜狗人工智能战略以语言为核心,布局“自然交互+知识计算”,在语音、图像、对话、翻译、问答等技术和应用水平上全球领先。本次大会,搜狗带来了一系列的AI产品,呈现了人工智能领域的技术变革与创新。
让AI从实验室走出去
在本次上海世界人工智能大会的“人工智能与实体经济深度融合发展论坛”上,工信部发布了《人工智能与实体经济深度融合创新项目》名单,搜狗商用神经翻译系统经北京经信委推荐、专家评审及项目公示后,荣获AI智能理解产品示范项目。
搜狗神经机器翻译技术由搜狗公司自行研发并已成功商用,具有完全自主知识产权,申请了11项发明专利,并荣获了WMT 2017世界机器翻译学术大赛的中译英、英译中双向机器翻译全球第一名。随着搜狗神经机器翻译技术与输入法、英文搜索、机器同传系统、智能翻译硬件等领域的深入融合,有效解决了传统方法中翻译知识获取耗时耗力、语种覆盖度受限的难题。目前,搜狗神经机器翻译技术的日均翻译请求达1.6亿次,覆盖全球超5亿用户,助力产品产生经济效益超人民币40亿元。
基于搜狗神经机器翻译技术研发的搜狗翻译机,研发了业内首个离线翻译技术模型,做到了离线翻译的准确率与在线翻译一致,翻译速度迅速,支持42种语音,覆盖了全球200多个国家和地区。同时,基于实景OCR技术,让翻译机成为业内首个支持拍照翻译的翻译产品,创新实现用户在境外可以查看菜单、路牌、文字说明等功能。
让AI技术从实验室里走出去,与产业结合,才能落地到用户的实际生活中来,展现出它的真正价值。
不用发出声音 黑科技就能猜透你的心
在人工智能大会上,搜狗带来的最新唇语识别技术成为了与会者关注的焦点。现场观众只需对着大屏幕不发出声音,光用嘴型说出一句话,如“吃葡萄不吐葡萄皮”,机器就能通过面部识别和唇型特征读出对应的发音,识别其说话内容,并生成文字呈现于大屏幕。
作为全球第一款中文唇语识别系统,搜狗中文唇语识别系统的识别技术基于数千小时的唇语数据计算,其首创复杂的端到端深度神经网络技术可进行中文唇语序列建模,在搜狗强大的自然语言处理技术的应用下,取得了业界领先的唇语识别效果。该系统也曾获得2017年乌镇世界互联网大会“世界互联网领先科技成果 ”等奖项。
据悉,搜狗唇语识别技术目前在车载、智能家居等特定场景下可以达到90%的准确率,可应用于嘈杂环境、辅助残障、身份识别、公共安全、军工军事等领域,帮助人们更好的理想和表达自己,打造多形态的人机交互,推动整个AI行业的技术革新。
语音合成进入高定版个性化时代
你听过搜狗公司CEO王小川所演唱的《蓝精灵之歌》吗?在本次上海世界人工智能大会上,搜狗带来了几个神秘彩蛋。通过搜狗自主研发的语音合成技术,仅通过少量原始声音数据,便可生成该说话者的合成音色,使现场观众可以感受到声似真人的人工智能合成声音。
在展会上,能够听到的王小川版《蓝精灵之歌》和贯口《报菜名》就是源于搜狗的语音合成技术。当现场观众在触摸屏上选择王小川的音色后,再选择歌曲《蓝精灵之歌》,通过风格迁移技术,最终生成了王小川版《蓝精灵之歌》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣地展现了了搜狗语音合成和风格迁移技术。
据了解,搜狗语音合成目前支持中英日韩等多个语种,男、女、童等数十个音色的合成,合成效果达到国际领先水平。该技术也夺得了刚刚落幕的“Blizzard Challenge 2018 ”国际语音合成大赛冠军,展现了搜狗在AI技术上的研发实力。
作为中国互联网的科技巨头,搜狗在2018人工智能大会上的产品展示,彰显了其布局AI产业的战略方向与领跑优势,给予了人们非常大的惊喜。相信在未来,搜狗还会沿着人工智能技术的道路不断前行,通过研发出更多的“黑科技”产品,让AI与我们一路相伴。