乱h生活会人妻互换,熟睡中の侵犯

聲智科技攜手百度，助力小度智能音箱成為“三好生”

 2020-06-19 23:01:57  sunmedia  1793

6月11日，百度“新聲出道”的小度新品發(fā)布會在北京百度科技園K6熊掌報告廳召開，新品“小度智能音箱”正式在后廠村C位“出道”，嘗鮮價89元。這款“后廠村C位出道”的百元AI實力擔當產品——“小度智能音箱”憑借“好聽、好用、好玩”的特性，新晉成為智能音箱屆的“三好生”！
?

? ? ? ?這款定價89元的小度智能音箱是如何成為智能音箱屆的“三好生”？聲智科技作為小度智能音箱的技術合作伙伴，帶您一起解鎖小度智能音箱背后的秘密武器！
?

? ? ? （1）好聽：采用全球首款3麥克風陣列設計，硬件毫不妥協(xié)！
?

? ? ? ?小度智能音箱作為一款定價89元的智能音箱，其跨級音質體驗是百元檔音質最佳的人工智能音箱。小度智能音箱音質出眾，卻身量小巧，而且有著毫不妥協(xié)的遠場語音交互體驗。它是如何平衡ID、音質設計和產品體驗之間的矛盾呢？
?

? ? ? ?作為一款支持遠場語音交互的智能音箱，一定離不開麥克風陣列。麥克風陣列的主要作用是幫助機器適應更加復雜的場景。麥克風陣列是由一定數目的聲學傳感器組成，用來對聲場的空間特性進行采樣并處理的系統(tǒng)，將會影響真實環(huán)境下的語音喚醒和識別率，是決定用戶體驗的關鍵因素。

? ? ? ?然而，當前市場上的麥克風陣列方案中，常見的陣型多為4麥，6麥，8麥等陣元的線型、環(huán)型、菱型等陣列方案，亞馬遜的Echo還采用過6+1麥的方案，亞馬遜主流產品仍在沿用6麥環(huán)形和8麥跑道型方案。從技術原理來看，更多數量麥克風的陣列方案在遠場語音交互效果上更具有優(yōu)勢，但是多麥陣型也限制了ID設計的想象空間，對音箱設計提出包括ID、成本等更多苛刻要求。
?

圖為麥克風陣列模組
?

? ? ? ?聲智科技為小度智能音箱量身打造的全球首款3麥環(huán)型麥克風陣列，很好的平衡了ID、成本、音質設計和產品體驗之間的矛盾。這款全球首款3麥克風陣列構型靈活，打破了音腔設計的局限，并釋放ID設計的無限空間，同時平衡了成本和效果之間的矛盾。

? ? ? 聲智科技推出的這款全球首款的3麥環(huán)型麥克風陣列內置通話降噪、混響抑制、回聲抵消、噪聲抑制、語音增強、波束形成、增益控制、語音識別等遠場語音交互技術，5米內的嘈雜環(huán)境中，仍可以有卓越的遠場語音喚醒性能、精準的遠近場語音識別，實現輕松喚醒，無懼環(huán)境，想說就說，聲隨心動，保證遠場語音交互的完美體驗。而且，相比4麥、6麥、8麥陣列方案的成本偏高，3麥陣列方案價格更加親民，相比2麥又有效果優(yōu)勢。

? ? ? ?不僅如此，為了釋放ID設計的無限空間，聲智科技針對小體積智能音箱尺寸特性，進行了獨家的技術優(yōu)化。小尺寸智能音箱的麥克風陣列與喇叭的位置，以及ID結構都較為受限，特別是麥克風陣列與大音量喇叭相距很近，帶給語音交互技術處理極大的壓力，特別是自噪聲抑制和遠場信號處理的難度極具增加。為了在這樣的特殊結構設計獲得更好的語音交互效果，聲智科技獨家設計優(yōu)化，采用抗強噪喚醒技術（AKS技術）、垂直抗強噪識別技術（VAN技術）、OpenAEC技術等提升遠場語音交互體驗。
?

? ? ? （2）好用：完整遠場語音喚醒和識別服務，又快又準！
?

? ? ? ?為了讓小度智能音箱更好用，提升產品的凈推薦值NPS，聲智科技通過SoundAI Voice Kit（以下簡稱SVK）為小度帶來更敏捷、更貼合人性化的語音交互設計。

? ? ? ?SVK是一款集成聲波配網、波束形成、聲源測向、定向拾音、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、語義理解、語音合成、雙工通話等全鏈路的智能語音交互開發(fā)套件，兼容主流智能語音硬件架構，支持DuerOS、AliGenies、小愛平臺、騰訊叮當、Amazon Alexa等主流AI平臺, 助力品牌廠商實現智能硬件產品的極速開發(fā)和量產上市。
?

? ? ? ?什么樣的響應時間才能帶來完美的語音交互體驗？人機語音交互是讓機器模擬人的行為，讓機器適應人類的交互習慣。大多數情況下，在生活中人與人對話時，一個過快的回答會給用戶帶來輕浮感和搶話感，而一個過慢的回答會給用戶帶來遲緩感和愚鈍感。因此智能音箱的響應時間對于用戶體驗至關重要。

?
? ? ? ?此次，小度智能音箱采用了聲智科技的SVK完整的遠場語音喚醒、遠場語音識別（FarField ASR）服務。聲智科技精準的“遠場語音喚醒技術”和”遠場語音識別技術”，面向垂直領域深度優(yōu)化，達到平均96%以上的準確率。而且，不僅識別率極大的提升，也帶來了更符合人性化的語音交互速度體驗，使得小度智能音箱從喚醒到內容的全鏈條響應速度達到全球極致的1.4S以內，而用戶喚醒以后的機器應答響應時間更是做到了400~500毫秒的極致速度。

? ? ? ?什么樣的語音喚醒體驗才能帶來完美語音交互體驗？語音喚醒是智能音箱用戶的第一體驗。聲智科技通過寬場景高靈敏喚醒技術，很好的平衡了喚醒率和誤喚醒率。眾所周知喚醒率和誤喚醒是一對蹺蹺板，當喚醒效果很好的時候，誤喚醒通常也會很高，智能音箱毫無征兆的突然喚醒也是很麻煩的事情。為解決這個矛盾，聲智科技的技術不走討巧路線，而是采用全新的喚醒模型，優(yōu)先保證用戶的體驗，在此基礎上再降低誤喚醒率，同時還要提升強噪環(huán)境下的喚醒率。

? ? ? ?當然，不同麥克風器件的選擇帶來不同的語音交互效果，信噪比（SNR）70dB以上的麥克風要比信噪比60DB的麥克風的遠場和抗噪效果更好，但是選用高信噪比的麥克風，其結果就是成本會高出很多。徹底屏蔽硬件的差異化，面向低成本高失真產品，努力幫助客戶降低成本，聲智科技推出了低成本高容錯喚醒技術。即便在一致性和失真度非常大的情況下，也要出色的保證用戶體驗的效果，這是聲智科技給所有客戶一直的承諾。

? ? ? ?什么樣的語音識別體驗才能帶來完美語音交互體驗？由于遠場智能產品的場景特殊性，遠場語音識別相對更加垂直，比如智能音箱的識別偏重于音樂和百科領域，智能汽車的識別偏重于地圖和音樂領域，而對于地域性的覆蓋，則是遠場語音識別著重考慮的，并不能簡單把方言劃歸為一個技術系列，特別是消費電子領域的高度標準化思維，對于遠場語音識別的場景兼容更加看重。所以聲智科技的FarField ASR就要在垂直領域考慮更多場景難題，不僅如此，為保證云端服務的穩(wěn)定性和并發(fā)能力，聲智科技采用端云強耦的技術架構，合理在端云分配計算能力，與Amazon AWS、阿里云等主流云計算平臺采用相同的服務可靠性標準，SLA高達99.99%。

? ? ? （3）好玩：滿足兒童與極客不同需求，解決寬場景難題

?
? ? ? ?真正的產品落地需要考慮眾多應用場景的難題，聲智科技的FarField ASR就要在垂直領域考慮更多場景難題，比如老人和小孩的識別怎么辦？南方和北方的語言差異怎么辦？而并非只是簡單的技術疊加。

? ? ? ?智能音箱市場的用戶群中有20%+是兒童，如何滿足兒童用戶群體的需求，提供零溝通距離，優(yōu)質精選內容，保證健康安全又不失好玩有趣的語音交互體驗？聲智科技推出了遠近場的兒童語音識別技術，針對兒童的語音特點，例如：兒童生理上發(fā)育不夠成熟，不善于掌握發(fā)音部位與方法，輔音發(fā)音分化不明顯。而且，兒童發(fā)音單音重復較多，往往發(fā)出單個的、重疊的音，他們會說“車車”、“糖糖”、“兔兔”、“飯飯”，而不說“汽車”、“糖”、“兔子”、“飯”這樣的兒童的交流方式，聲智科技進行聲學模型優(yōu)化訓練，升級打造ASR技術，使得兒童識別率更準確，更貼合兒童的交互習慣。

? ? ? ?除了兒童模式，小度智能音箱還推出了極客模式。極客模式下，一次喚醒之后，用戶可以進行多輪對話。針對用戶多輪對話的語音交互需求，聲智科技推出了支持多輪對話的端云交互技術，從麥克風陣列、語音喚醒、端點檢測和語音識別四個技術鏈條進行深度優(yōu)化，滿足了百度對于用戶體驗的極致追求。其中，端點檢測技術既要保證響應速度，又要準確識別斷句以保證語言連貫性，在復雜場景下的技術實現非常困難。聲智科技率先突破這些技術難關，將會推動智能音箱技術向著更加智能的方向快速發(fā)展。

? ? ? ?隨著用戶認知度提升、整體產業(yè)鏈的成熟、用戶體驗提升等因素，2018年智能音箱將會持續(xù)爆發(fā)。但語音交互技術仍需繼續(xù)發(fā)力，聲智科技作為國內知名的語音交互技術提供商，將持續(xù)聚焦在技術領域，與眾多合作伙伴一道推動智能語音行業(yè)的發(fā)展。

聽? 你? 所? 言，知? 你? 所? 想

聲? 智? 科? 技

 未知來源

上一篇：新聞營銷為泵閥企業(yè)品牌推廣注入新的活力

下一篇：河北企業(yè)網服務構筑促進企業(yè)做大做強

免責聲明：商媒在線所提供的信息及圖片除原創(chuàng)外，有部分資訊和圖片從網絡等媒體收集而來，版權歸原作者及媒體網站所有，商媒在線力求保存原有的版權信息并盡可能注明來源；部分因為操作上的原因可能已將原有信息丟失，敬請原作者諒解，如果您對商媒在線所載文章及圖片版權的歸屬存有異議，請立即通知商媒在線，商媒在線將立即予以刪除，同時向您表示歉意！

聲智科技攜手百度，助力小度智能音箱成為“三好生”

相關推薦

最新資訊

 投訴建議

 聯(lián)系我們