යෙදුම් ගණන සහ හඬ අතුරුමුහුණත්වල වැදගත්කම වේගයෙන් වර්ධනය වේ
තාක්ෂණය

යෙදුම් ගණන සහ හඬ අතුරුමුහුණත්වල වැදගත්කම වේගයෙන් වර්ධනය වේ

ඔරිගන්හි පෝට්ලන්ඩ් හි ඇමරිකානු පවුලක් මෑතකදී දැනගත්තේ ඇලෙක්ස්ගේ හඬ සහායකයා ඔවුන්ගේ පුද්ගලික කතාබස් පටිගත කර මිතුරෙකුට යවන බවයි. මාධ්‍ය විසින් ඩැනියෙල් ලෙස නම් කරන ලද නිවසේ හිමිකරු වාර්තාකරුවන්ට පැවසුවේ “ඇයව විශ්වාස කළ නොහැකි නිසා නැවත කිසි දිනෙක මෙම උපාංගය සම්බන්ධ නොකරන” බවයි.

ඇලෙක්සා, Echo (1) ස්පීකර් සහ අනෙකුත් උපකරණ මගින් සපයනු ලබන මිලියන ගණනක එක්සත් ජනපද නිවාස, එහි නම හෝ පරිශීලකයා විසින් කතා කරන "ඇමතුම් වචනය" ඇසෙන විට පටිගත කිරීම ආරම්භ කරයි. මෙයින් අදහස් කරන්නේ රූපවාහිනී දැන්වීමක "Alexa" යන වචනය සඳහන් වුවද, උපාංගය පටිගත කිරීම ආරම්භ කළ හැකි බවයි. දෘඪාංග බෙදාහරින්නා වන Amazon පවසන්නේ මෙම නඩුවේදී එය හරියටම සිදු වූ බවයි.

"සංවාදයේ ඉතිරි කොටස හඬ සහායකයා විසින් පණිවිඩයක් යැවීමට විධානයක් ලෙස අර්ථකථනය කර ඇත," සමාගම නිවේදනයක් නිකුත් කරමින් කියා සිටියේය. "යම් අවස්ථාවක, ඇලෙක්සා හයියෙන් ඇසුවා: "කාටද?" දැවමය බිම් සැකසීම පිළිබඳ පවුලේ සංවාදය දිගටම කරගෙන යාම යන්ත්‍රය පාරිභෝගිකයාගේ සම්බන්ධතා ලැයිස්තුවේ අයිතමයක් ලෙස වටහාගෙන තිබිය යුතුය. අඩුම තරමින් ඇමේසන් සිතන්නේ එයයි. මේ අනුව, පරිවර්තනය අනතුරු මාලාවක් දක්වා අඩු වේ.

කෙසේ වෙතත්, කනස්සල්ල තවමත් පවතී. මක්නිසාද යත්, කිසියම් හේතුවක් නිසා, අපට තවමත් පහසුවක් දැනෙන නිවසක, අපට යම් ආකාරයක “හඬ මාදිලියකට” ඇතුළු විය යුතු අතර, අප පවසන දේ, රූපවාහිනිය විකාශනය කරන දේ සහ, ඇත්ත වශයෙන්ම, මෙම නව කථිකයා පපුවේ ඇති දේ නැරඹීමට සිදුවේ. ලාච්චු පවසයි . අප.

කෙසේ වුවද, තාක්‍ෂණික අසම්පූර්ණකම් සහ පෞද්ගලිකත්වය පිළිබඳ ගැටළු තිබියදීත්, Amazon Echo වැනි උපාංගවල ජනප්‍රියතාවය ඉහළ යාමත් සමඟ, මිනිසුන් තම කටහඬ භාවිතා කරමින් පරිගණක සමඟ අන්තර් ක්‍රියා කිරීමේ අදහසට හුරු වීමට පටන් ගෙන තිබේ..

Amazon හි CTO, Werner Vogels, 2017 අගභාගයේදී ඔහුගේ AWS re:Invent සැසියේදී සඳහන් කළ පරිදි, තාක්‍ෂණය මෙතෙක් අපට පරිගණක සමඟ අන්තර් ක්‍රියා කිරීමේ හැකියාව සීමා කර ඇත. අපි යතුරුපුවරුව භාවිතයෙන් Google වෙත මූල පද ටයිප් කරන්නෙමු, මෙය තවමත් යන්ත්‍රයට තොරතුරු ඇතුළත් කිරීමට වඩාත් පොදු සහ පහසුම ක්‍රමය වන බැවිනි.

වෝගල්ස් පැවසීය. -

විශාල හතරක්

දුරකථනයේ ගූගල් සෙවුම් යන්ත්‍රය භාවිතා කරන විට, බොහෝ කලකට පෙර කතා කිරීමට ඇමතුමක් සහිත මයික්‍රෆෝන ලකුණක් අප දැක ඇති. මේ ගූගල් දැන් (2), සෙවුම් විමසුමක් නියම කළ හැකි, කටහඬින් පණිවිඩයක් ඇතුළු කරන්න, යනාදිය. මෑත වසරවලදී Google, Apple සහ Amazon විශාල වශයෙන් දියුණු වී ඇත. හඬ හඳුනාගැනීමේ තාක්ෂණය. Alexa, Siri, සහ Google Assistant වැනි Voice Assistants ඔබේ කටහඬ පටිගත කරනවා පමණක් නොව, ඔබ ඔවුන්ට පවසන දේ තේරුම් ගෙන ප්‍රශ්නවලට පිළිතුරු සපයයි.

Google Now සියලුම Android පරිශීලකයින්ට නොමිලේ ලබා ගත හැකිය. යෙදුමට, උදාහරණයක් ලෙස, අනතුරු ඇඟවීමක් සැකසීමට, කාලගුණ අනාවැකි පරීක්ෂා කිරීමට සහ Google සිතියම් මත මාර්ගය පරීක්ෂා කිරීමට හැකිය. Google Now හි සංවාද දිගුව සඳහන් කරයි Google සහායක () - උපකරණ භාවිතා කරන්නාට අතථ්‍ය සහාය. එය ප්‍රධාන වශයෙන් ජංගම සහ ස්මාර්ට් නිවාස උපාංගවල පවතී. Google Now මෙන් නොව, එය ද්වි-මාර්ග හුවමාරුවකට සහභාගී විය හැක. සහකරු 2016 මැයි මාසයේදී Google පණිවිඩකරණ යෙදුම Allo හි කොටසක් ලෙස මෙන්ම Google Home voice speaker (3) හි ආරම්භ විය.

3. Google Home

IOS පද්ධතියට තමන්ගේම අතථ්‍ය සහකාර ද ඇත, සිරි, එය Apple හි මෙහෙයුම් පද්ධති iOS, watchOS, tvOS homepod සහ macOS සමඟ ඇතුළත් වැඩසටහනකි. Siri iOS 5 සහ iPhone 4s සමඟ 2011 ඔක්තෝම්බර් මාසයේදී Let's Talk iPhone සම්මන්ත්‍රණයේදී ආරම්භ විය.

මෘදුකාංගය සංවාද අතුරුමුහුණතක් මත පදනම් වේ: එය පරිශීලකයාගේ ස්වාභාවික කථාව හඳුනා ගනී (iOS 11 සමඟ එය අතින් විධාන ඇතුළත් කිරීමට ද හැකිය), ප්‍රශ්නවලට පිළිතුරු සහ කාර්යයන් සම්පූර්ණ කරයි. යන්ත්‍ර ඉගෙනීම හඳුන්වාදීමට ස්තූතියි, කාලයත් සමඟ සහායකයෙක් පුද්ගලික මනාපයන් විශ්ලේෂණය කරයි වඩාත් අදාළ ප්‍රතිඵල සහ නිර්දේශ සැපයීමට පරිශීලකයා. Siri හට නිරන්තර අන්තර්ජාල සම්බන්ධතාවයක් අවශ්‍ය වේ - මෙහි ප්‍රධාන තොරතුරු මූලාශ්‍ර වන්නේ Bing සහ Wolfram Alpha වේ. iOS 10 තෙවන පාර්ශවීය දිගු සඳහා සහය හඳුන්වා දුන්නේය.

ලොකු හතරෙන් තව එකෙක් කෝර්ටනා. එය මයික්‍රොසොෆ්ට් විසින් නිර්මාණය කරන ලද බුද්ධිමත් පුද්ගලික සහායකයෙකි. එය Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, Android සහ iOS වේදිකාවල සහය දක්වයි. Cortana මුලින්ම හඳුන්වා දුන්නේ 2014 අප්‍රේල් මාසයේදී San Francisco හි පැවති Microsoft Build Developer Conference හිදීය. වැඩසටහනේ නම පැමිණෙන්නේ Halo ක්‍රීඩා මාලාවේ චරිතයක නමකිනි. Cortana ඉංග්‍රීසි, ඉතාලි, ස්පාඤ්ඤ, ප්‍රංශ, ජර්මන්, චීන සහ ජපන් යන භාෂාවලින් ලබාගත හැක.

දැනටමත් සඳහන් කර ඇති වැඩසටහන භාවිතා කරන්නන් ඇලෙක්සා ඔවුන් භාෂා සීමාවන් ද සලකා බැලිය යුතුය - ඩිජිටල් සහායකයා ඉංග්‍රීසි, ජර්මානු, ප්‍රංශ සහ ජපන් පමණක් කතා කරයි.

Amazon Virtual Assistant මුලින්ම භාවිත කළේ Amazon Lab126 විසින් වැඩි දියුණු කරන ලද Amazon Echo සහ Amazon Echo Dot ස්මාර්ට් ස්පීකර් වලයි. එය හඬ අන්තර්ක්‍රියා, සංගීත වාදනය, කළ යුතු ලැයිස්තු නිර්මාණය, එලාම් සැකසීම, පොඩ්කාස්ට් ප්‍රවාහය, ශ්‍රව්‍ය පොත් නැවත ධාවනය සහ තත්‍ය කාලීන කාලගුණය, ගමනාගමනය, ක්‍රීඩා සහ ප්‍රවෘත්ති (4) වැනි වෙනත් ප්‍රවෘත්ති තොරතුරු සබල කරයි. Alexa හට ගෘහ ස්වයංක්‍රීය පද්ධතියක් නිර්මාණය කිරීමට බහු ස්මාර්ට් උපාංග පාලනය කළ හැක. ඇමේසන් වෙළඳසැලේ පහසු සාප්පු සවාරි කිරීමටද එය භාවිතා කළ හැකිය.

4. පරිශීලකයින් Echo භාවිතා කරන්නේ කුමක් සඳහාද (පර්යේෂණවලට අනුව)

පරිශීලකයින්ට Alexa "නිපුණතා" (), තෙවන පාර්ශවයන් විසින් වැඩි දියුණු කරන ලද අතිරේක විශේෂාංග ස්ථාපනය කිරීමෙන් Alexa අත්දැකීම වැඩි දියුණු කළ හැක, වෙනත් සැකසුම් වල කාලගුණය සහ ශ්‍රව්‍ය වැඩසටහන් වැනි යෙදුම් ලෙස පොදුවේ හැඳින්වේ. බොහෝ ඇලෙක්සා උපාංග ඔබට ඔබගේ අතථ්‍ය සහායකයා අවදි කිරීමේ මුරපදයක් සමඟින් සක්‍රිය කිරීමට ඉඩ සලසයි.

Amazon අද (5) ස්මාර්ට් ස්පීකර් වෙළඳපොලේ නියත වශයෙන්ම ආධිපත්‍යය දරයි. 2018 මාර්තු මාසයේදී නව සේවාවක් හඳුන්වා දුන් IBM පළමු හතරට ඇතුළු වීමට උත්සාහ කරයි වොට්සන්ගේ සහායකයා, කටහඬ පාලනයක් සහිත තමන්ගේම අතථ්‍ය සහායක පද්ධති නිර්මාණය කිරීමට අවශ්‍ය සමාගම් සඳහා නිර්මාණය කර ඇත. IBM විසඳුමේ වාසිය කුමක්ද? සමාගම් නියෝජිතයින්ට අනුව, පළමුවෙන්ම, පුද්ගලීකරණය සහ පෞද්ගලිකත්වය ආරක්ෂා කිරීම සඳහා වඩා විශාල අවස්ථාවන් මත.

පළමුව, වොට්සන් සහකාර හංවඩු ගසා නැත. සමාගම්වලට මෙම වේදිකාව මත තමන්ගේම විසඳුම් නිර්මාණය කර ඔවුන්ගේම වෙළඳ නාමයක් සමඟ ඒවා ලේබල් කළ හැකිය.

දෙවනුව, ඔවුන්ට ඔවුන්ගේම දත්ත කට්ටල භාවිතයෙන් ඔවුන්ගේ සහායක පද්ධති පුහුණු කළ හැකි අතර, අනෙකුත් VUI (හඬ පරිශීලක අතුරුමුහුණත) තාක්ෂණයන්ට වඩා එම පද්ධතියට විශේෂාංග සහ විධාන එක් කිරීම පහසු කරන බව IBM පවසයි.

තෙවනුව, Watson Assistant පරිශීලක ක්‍රියාකාරකම් පිළිබඳ තොරතුරු IBM වෙත ලබා නොදේ - වේදිකාවේ විසඳුම් සංවර්ධකයින්ට වටිනා දත්ත පමණක් තබා ගත හැකිය. මේ අතර, උපාංග සාදන ඕනෑම අයෙකු, උදාහරණයක් ලෙස Alexa සමඟ, ඔවුන්ගේ වටිනා දත්ත Amazon මත අවසන් වන බව දැන සිටිය යුතුය.

Watson Assistant සතුව දැනටමත් ක්‍රියාත්මක කිරීම් කිහිපයක් ඇත. උදාහරණයක් ලෙස, Maserati සංකල්ප මෝටර් රථය (6) සඳහා හඬ සහායකයක් නිර්මාණය කරන ලද Harman විසින් මෙම පද්ධතිය භාවිතා කරන ලදී. මියුනිච් ගුවන් තොටුපළේදී, IBM සහායකයකු මගීන්ට එහා මෙහා යාමට උපකාර කිරීම සඳහා ගම්මිරිස් රොබෝවක් බලගන්වයි. තුන්වන උදාහරණය නම් Chameleon Technologies වන අතර එහිදී ස්මාර්ට් හෝම් මීටරයක හඬ තාක්ෂණය භාවිතා වේ.

6. Maserati සංකල්ප මෝටර් රථයක Watson Assistant

මෙහි යටින් පවතින තාක්ෂණය ද අලුත් නොවන බව එකතු කිරීම වටී. Watson Assistant හට දැනට පවතින IBM නිෂ්පාදන, Watson Conversation, සහ Watson Virtual Agent සඳහා සංකේතන හැකියාවන් මෙන්ම භාෂා විශ්ලේෂණය සහ කතාබස් සඳහා API ඇතුළත් වේ.

Amazon ස්මාර්ට් හඬ තාක්ෂණයේ ප්රමුඛයා පමණක් නොව, එය සෘජු ව්යාපාරයක් බවට පත් කරයි. කෙසේ වෙතත්, සමහර සමාගම් බොහෝ කලකට පෙර Echo ඒකාබද්ධ කිරීම අත්හදා බලා ඇත. BI සහ විශ්ලේෂණ කර්මාන්තයේ සමාගමක් වන Sisense, 2016 ජූලි මාසයේදී Echo ඒකාබද්ධ කිරීම හඳුන්වා දෙන ලදී. අනෙක් අතට, ආරම්භක Roxy ආගන්තුක සත්කාර කර්මාන්තය සඳහා තමන්ගේම හඬ-පාලිත මෘදුකාංග සහ දෘඩාංග නිර්මාණය කිරීමට තීරණය කළේය. මෙම වසර මුලදී, Synqq විසින් යතුරු පුවරුවක ටයිප් කිරීමකින් තොරව සටහන් සහ දින දර්ශන ඇතුළත් කිරීම් සඳහා හඬ සහ ස්වභාවික භාෂා සැකසුම් භාවිතා කරන සටහන් ගැනීමේ යෙදුමක් හඳුන්වා දෙන ලදී.

මෙම කුඩා ව්‍යාපාර සියල්ලටම ඉහළ අභිලාෂයන් ඇත. කෙසේ වෙතත්, සියල්ලටම වඩා, සෑම පරිශීලකයෙකුටම තම දත්ත ඇමේසන්, ගූගල්, ඇපල් හෝ මයික්‍රොසොෆ්ට් වෙත මාරු කිරීමට අවශ්‍ය නොවන බව ඔවුන් ඉගෙන ගත්හ, ඒවා හඬ සන්නිවේදන වේදිකා ගොඩනැගීමේ වැදගත්ම ක්‍රීඩකයින් වේ.

ඇමරිකානුවන්ට මිලදී ගැනීමට අවශ්‍යයි

2016 දී, සියලුම Google ජංගම සෙවුම් වලින් 20% කට හඬ සෙවීම. මෙම තාක්ෂණය දිනපතා භාවිතා කරන පුද්ගලයින් එහි පහසුව සහ බහුකාර්යය එහි විශාලතම ප්‍රතිලාභ අතර සඳහන් කරයි. (උදාහරණයක් ලෙස, මෝටර් රථයක් ධාවනය කිරීමේදී සෙවුම් යන්ත්රයක් භාවිතා කිරීමේ හැකියාව).

Visiongain විශ්ලේෂකයින් ස්මාර්ට් ඩිජිටල් සහායකයන්ගේ වර්තමාන වෙළඳපල වටිනාකම ඩොලර් බිලියන 1,138 ක් ලෙස ගණන් බලා ඇත.එවැනි යාන්ත්‍රණ වැඩි වැඩියෙන් තිබේ. ගාට්නර්ට අනුව, 2018 අවසන් වන විට දැනටමත් අපගේ අන්තර්ක්‍රියා වලින් 30% තාක්ෂණය සමඟ හඬ පද්ධති සමඟ සංවාද හරහා වනු ඇත.

බ්‍රිතාන්‍ය පර්යේෂණ ආයතනයක් වන IHS Markit ඇස්තමේන්තු කරන්නේ AI බලයෙන් ක්‍රියාත්මක වන ඩිජිටල් සහායකයින් සඳහා වන වෙළඳපල මෙම වසර අවසන් වන විට උපාංග බිලියන 4 දක්වා ළඟා වනු ඇති අතර 2020 වන විට එම සංඛ්‍යාව බිලියන 7 දක්වා ඉහළ යා හැකි බවයි.

eMarketer සහ VoiceLabs හි වාර්තාවලට අනුව, ඇමරිකානුවන් මිලියන 2017 ක් 35,6 දී අවම වශයෙන් මසකට වරක් හඬ පාලනය භාවිතා කළහ. මෙයින් අදහස් කරන්නේ පෙර වසරට වඩා 130% ක පමණ වැඩිවීමකි. ඩිජිටල් සහකාර වෙළඳපොළ පමණක් 2018 හි 23% කින් වර්ධනය වනු ඇතැයි අපේක්ෂා කෙරේ. මෙයින් අදහස් කරන්නේ ඔබ දැනටමත් ඒවා භාවිතා කරන බවයි. ඇමරිකානුවන් මිලියන 60,5 කි, ඔවුන්ගේ නිෂ්පාදකයින් සඳහා කොන්ක්රීට් මුදල් ප්රතිඵලයක් වනු ඇත. RBC Capital Markets ඇස්තමේන්තු කරන්නේ ඇලෙක්සා අතුරුමුහුණත 2020 වන විට ඇමසන් සඳහා ඩොලර් බිලියන 10 දක්වා ආදායමක් උපයනු ඇති බවයි.

සෝදන්න, පිළිස්සීම, පිරිසිදු කරන්න!

හඬ අතුරුමුහුණත් වැඩි වැඩියෙන් නිර්භීතව ගෘහ උපකරණ සහ පාරිභෝගික ඉලෙක්ට්රොනික වෙළඳපොළට ඇතුල් වේ. පසුගිය වසරේ IFA 2017 ප්‍රදර්ශනය අතරතුර මෙය දැනටමත් දැකගත හැකි විය.ඇමරිකානු සමාගමක් වන Neato Robotics, උදාහරණයක් ලෙස, Amazon Echo පද්ධතිය ඇතුළු ස්මාර්ට් හෝම් වේදිකා කිහිපයකින් එකකට සම්බන්ධ වන රොබෝ වැකුම් ක්ලීනර් හඳුන්වා දුන්නේය. Echo ස්මාර්ට් ස්පීකරය සමඟ කතා කිරීමෙන්, දිවා හෝ රාත්‍රියේ නිශ්චිත වේලාවක ඔබේ මුළු නිවසම පිරිසිදු කිරීමට යන්ත්‍රයට උපදෙස් දිය හැකිය.

තුර්කි සමාගමක් වන Vestel විසින් Toshiba සන්නාමය යටතේ අලෙවි කරන ස්මාර්ට් රූපවාහිනීවල සිට ජර්මානු සමාගමක් වන බියුරර් විසින් රත් කරන ලද බ්ලැන්කට් දක්වා අනෙකුත් හඬ-ක්‍රියාකාරී නිෂ්පාදන ප්‍රදර්ශනයේදී ප්‍රදර්ශනය කරන ලදී. මෙම බොහෝ ඉලෙක්ට්‍රොනික උපාංග ස්මාර්ට්ෆෝන් භාවිතයෙන් දුරස්ථව ක්‍රියාත්මක කළ හැකිය.

කෙසේ වෙතත්, Bosch නියෝජිතයින්ට අනුව, ගෘහ සහකාර විකල්පයන්ගෙන් ප්‍රමුඛ වන්නේ කුමක්දැයි කීමට ඉක්මන් වැඩිය. IFA 2017 දී, ජර්මානු තාක්ෂණික කණ්ඩායමක් Echo වෙත සම්බන්ධ වන රෙදි සෝදන යන්ත්‍ර (7), උඳුන් සහ කෝපි යන්ත්‍ර ප්‍රදර්ශනය කරන ලදී. Bosch හට අනාගතයේදී Google සහ Apple හඬ වේදිකා සමඟ එහි උපාංග අනුකූල වීමට අවශ්‍ය වේ.

7. Amazon Echo වෙත සම්බන්ධ වන Bosch රෙදි සෝදන යන්ත්රය

Fujitsu, Sony සහ Panasonic වැනි සමාගම් ඔවුන්ගේම AI මත පදනම් වූ හඬ සහායක විසඳුම් සංවර්ධනය කරමින් සිටී. ෂාප් විසින් මෙම තාක්ෂණය අවන් වලට සහ වෙළඳපොලට එන කුඩා රොබෝවරුන්ට එක් කරයි. Nippon Telegraph & Telephone හඬ-පාලිත කෘතිම බුද්ධි පද්ධතියක් අනුවර්තනය කිරීම සඳහා දෘඩාංග සහ සෙල්ලම් බඩු සාදන්නන් බඳවා ගනී.

පැරණි සංකල්පය. අවසානයේ ඇයගේ කාලය පැමිණ තිබේද?

ඇත්ත වශයෙන්ම, Voice User Interface (VUI) සංකල්පය දශක ගණනාවක් තිස්සේ පැවතුනි. වසර 2001 පමණ වන විට Star Trek හෝ 2000: A Space Odyssey නැරඹූ ඕනෑම අයෙක් 1986 දී පමණ අපගේ හඬින් පරිගණක පාලනය කරනු ඇතැයි අපේක්ෂා කළ හැකිය. එසේම, මෙම ආකාරයේ අතුරු මුහුණතක විභවය දුටුවේ විද්‍යා ප්‍රබන්ධ ලේඛකයින් පමණක් නොවේ. 2000 දී, නීල්සන් පර්යේෂකයන් තොරතුරු තාක්ෂණ වෘත්තිකයන්ගෙන් විමසුවේ XNUMX වසර වන විට පරිශීලක අතුරුමුහුණත්වල විශාලතම වෙනස කුමක්දැයි ඔවුන් සිතන්නේ කුමක්ද යන්නයි. ඔවුන් බොහෝ විට කටහඬ අතුරුමුහුණත් සංවර්ධනය කිරීමට යොමු විය.

එවැනි විසඳුමක් බලාපොරොත්තු වීමට හේතු තිබේ. වාචික සන්නිවේදනය, සියල්ලට පසු, මිනිසුන්ට සවිඥානිකව සිතුවිලි හුවමාරු කර ගැනීම සඳහා වඩාත්ම ස්වාභාවික මාර්ගය වන අතර, එය මානව-යන්ත්‍ර අන්තර්ක්‍රියා සඳහා භාවිතා කිරීම මෙතෙක් ඇති හොඳම විසඳුම ලෙස පෙනේ.

පළමු VUI වලින් එකක් ලෙස හැඳින්වේ සපත්තු පෙට්ටිය, IBM විසින් 60 දශකයේ මුල් භාගයේදී නිර්මාණය කරන ලදී. එය වර්තමාන හඬ හඳුනාගැනීමේ පද්ධතිවල පූර්වගාමියා විය. කෙසේ වෙතත්, VUI උපාංග සංවර්ධනය පරිගණක බලයේ සීමාවන් මගින් සීමා විය. මිනිස් කථනය තත්‍ය කාලීනව විග්‍රහ කිරීම සහ අර්ථ නිරූපණය කිරීම සඳහා විශාල උත්සාහයක් අවශ්‍ය වන අතර, එය සැබවින්ම කළ හැකි තත්ත්වයට පැමිණීමට වසර පනහකට වැඩි කාලයක් ගත විය.

හඬ අතුරු මුහුණතක් සහිත උපාංග 90 ගණන්වල මැද භාගයේ මහා පරිමාණ නිෂ්පාදනයේ පෙනී සිටීමට පටන් ගත් නමුත් ජනප්රියත්වය ලබා ගත්තේ නැත. හඬ පාලනය (ඇමතුම) සහිත පළමු දුරකථනය විය පිලිප්ස් ස්පාර්ක්1996 දී නිකුත් කරන ලදී. කෙසේ වෙතත්, මෙම නව්‍ය සහ භාවිතයට පහසු උපාංගය තාක්ෂණික සීමාවන්ගෙන් නිදහස් නොවීය.

හඬ අතුරුමුහුණත් ආකෘතිවලින් සමන්විත වෙනත් දුරකථන (RIM, Samsung හෝ Motorola වැනි සමාගම් විසින් නිර්මාණය කරන ලද) නිතිපතා වෙළඳපොළට පැමිණෙන අතර, පරිශීලකයින්ට හඬ මගින් ඇමතීමට හෝ කෙටි පණිවිඩ යැවීමට ඉඩ සලසයි. කෙසේ වෙතත්, ඔවුන් සියල්ලන්ටම නිශ්චිත විධාන මතක තබා ගැනීම සහ එකල උපාංගවල හැකියාවන්ට අනුවර්තනය වූ බලහත්කාරයෙන්, කෘතිම ආකාරයෙන් ඒවා උච්චාරණය කිරීම අවශ්ය විය. මෙය දෝෂ විශාල ප්‍රමාණයක් ජනනය කළ අතර, එය පරිශීලක අතෘප්තියට හේතු විය.

කෙසේ වෙතත්, අපි දැන් පරිගණක තාක්ෂණයේ නව යුගයකට පිවිසෙමින් සිටිමු, යන්ත්‍ර ඉගෙනීමේ දියුණුව සහ කෘතිම බුද්ධිය තාක්‍ෂණය සමඟ අන්තර් ක්‍රියා කිරීමට නව ක්‍රමයක් ලෙස සංවාදයේ විභවයන් අගුළු හරින (8). හඬ අන්තර්ක්‍රියා සඳහා සහාය දක්වන උපාංග සංඛ්‍යාව VUI සංවර්ධනයට විශාල බලපෑමක් ඇති කළ වැදගත් සාධකයක් වී ඇත. අද වන විට, ලෝක ජනගහනයෙන් 1/3 කට ආසන්න ප්‍රමාණයක් දැනටමත් මෙවැනි හැසිරීම් සඳහා භාවිතා කළ හැකි ස්මාර්ට්ෆෝන් සතුය. බොහෝ පරිශීලකයින් අවසානයේ ඔවුන්ගේ හඬ අතුරුමුහුණත් අනුවර්තනය කිරීමට සූදානම් බව පෙනේ.

8. කටහඬ අතුරුමුහුණත සංවර්ධනය කිරීමේ නවීන ඉතිහාසය

කෙසේ වෙතත්, A Space Odyssey හි චරිත කළාක් මෙන්, අපට පරිගණකයකට නිදහසේ කතා කිරීමට පෙර, අපි ගැටළු ගණනාවක් ජය ගත යුතුය. භාෂාමය සූක්ෂ්මතා හැසිරවීමට යන්ත්‍ර තවමත් එතරම් හොඳ නැත. ඊට අමතරව සෙවුම් යන්ත්‍රයකට හඬ විධාන ලබා දීමෙන් බොහෝ දෙනෙකුට තවමත් අපහසුතාවයක් දැනේ.

සංඛ්‍යාලේඛන පෙන්වා දෙන්නේ හඬ සහායකයින් මූලික වශයෙන් නිවසේ හෝ සමීප මිතුරන් අතර භාවිතා කරන බවයි. සම්මුඛ පරීක්ෂණයට ලක් වූ කිසිවෙක් පොදු ස්ථානවල හඬ සෙවීම භාවිත කළ බව පිළිගත්තේ නැත. කෙසේ වෙතත්, මෙම තාක්ෂණය පැතිරීමත් සමඟ මෙම අවහිරය අතුරුදහන් වීමට ඉඩ ඇත.

තාක්ෂණික වශයෙන් දුෂ්කර ප්රශ්නයක්

පද්ධති (ASR) මුහුණ දෙන ගැටලුව වන්නේ කථන සංඥාවකින් ප්රයෝජනවත් දත්ත උපුටා ගැනීම සහ පුද්ගලයෙකුට නිශ්චිත අර්ථයක් ඇති යම් වචනයක් සමඟ එය සම්බන්ධ කිරීමයි. සෑම අවස්ථාවකදීම නිපදවන ශබ්ද වෙනස් වේ.

කථන සංඥා විචලනය එහි ස්වාභාවික දේපල වේ, අපි උදාහරණයක් ලෙස, උච්චාරණයක් හෝ ස්වරයක් හඳුනා ගැනීමට ස්තූතියි. කථන හඳුනාගැනීමේ පද්ධතියේ සෑම අංගයක්ම නිශ්චිත කාර්යයක් ඇත. සැකසූ සංඥාව සහ එහි පරාමිතීන් මත පදනම්ව, භාෂා ආකෘතිය සමඟ සම්බන්ධ වන ධ්වනි ආකෘතියක් නිර්මාණය කර ඇත. හඳුනාගැනීමේ පද්ධතිය කුඩා හෝ විශාල රටා ගණනක පදනම මත ක්‍රියා කළ හැකි අතර, එය ක්‍රියා කරන වචන මාලාවේ ප්‍රමාණය තීරණය කරයි. ඔවුන් විය හැක කුඩා ශබ්දකෝෂ තනි වචන හෝ විධාන හඳුනා ගන්නා පද්ධති සම්බන්ධයෙන් මෙන්ම විශාල දත්ත සමුදායන් භාෂා කට්ටලයට සමාන අඩංගු වන අතර භාෂා ආකෘතිය (ව්යාකරණ) සැලකිල්ලට ගනිමින්.

පළමු ස්ථානයේ හඬ අතුරු මුහුණත් මුහුණ දෙන ගැටළු කථාව නිවැරදිව තේරුම් ගන්න, උදාහරණයක් ලෙස, සම්පූර්ණ ව්‍යාකරණ අනුපිළිවෙලවල් බොහෝ විට මඟ හැරී ඇති අතර, භාෂාමය සහ ශබ්ද දෝෂ, දෝෂ, අතපසුවීම්, කථන දෝෂ, සමජාතීය, අසාධාරණ පුනරාවර්තන යනාදිය සිදු වේ. මෙම සියලුම ACP පද්ධති ඉක්මනින් සහ විශ්වාසදායක ලෙස ක්‍රියා කළ යුතුය. අවම වශයෙන් ඒවා අපේක්ෂාවන් වේ.

දුෂ්කරතා මූලාශ්රය ද හඳුනාගැනීමේ පද්ධතියේ ආදානයට ඇතුල් වන පිළිගත් කථාව හැර වෙනත් ධ්වනි සංඥා, i.e. සියලු වර්ගවල බාධා කිරීම් සහ ශබ්දය. සරලම අවස්ථාවක, ඔබට ඒවා අවශ්ය වේ පෙරීම. මෙම කාර්යය සාමාන්ය සහ පහසු බව පෙනේ - සියල්ලට පසු, විවිධ සංඥා පෙරා ඇති අතර සෑම ඉලෙක්ට්රොනික ඉංජිනේරුවෙක්ම එවැනි තත්වයක් තුළ කළ යුතු දේ දනී. කෙසේ වෙතත්, කථන හඳුනාගැනීමේ ප්රතිඵලය අපගේ අපේක්ෂාවන් සපුරාලීමට නම් මෙය ඉතා ප්රවේශමෙන් හා ප්රවේශමෙන් කළ යුතුය.

දැනට භාවිතා කරන පෙරහන මඟින් කථන සංඥාව සමඟින් මයික්‍රොෆෝනය මගින් ලබා ගන්නා බාහිර ශබ්දය සහ කථන සංඥාවේ අභ්‍යන්තර ගුණාංග ඉවත් කිරීමට හැකි වන අතර එය හඳුනා ගැනීමට අපහසු වේ. කෙසේ වෙතත්, වඩාත් සංකීර්ණ තාක්ෂණික ගැටළුවක් පැන නගින්නේ විශ්ලේෂණය කරන ලද කථන සංඥාවට බාධා කරන විට ... තවත් කථන සංඥාවක්, එනම්, උදාහරණයක් ලෙස, අවට ඝෝෂාකාරී සාකච්ඡා. මෙම ප්රශ්නය සාහිත්යයේ ඊනියා ලෙස හැඳින්වේ. මෙය දැනටමත් සංකීර්ණ ක්රම භාවිතා කිරීම අවශ්ය වේ, ඊනියා. deconvolution සංඥාව (ලෙස)

කථන හඳුනාගැනීමේ ගැටළු එතැනින් අවසන් නොවේ. කථනය විවිධ ආකාරයේ තොරතුරු රැගෙන යන බව වටහා ගැනීම වටී. මිනිස් කටහඬ මගින් අයිතිකරුගේ ලිංගභේදය, වයස, විවිධ චරිත හෝ ඔහුගේ සෞඛ්‍ය තත්වය යෝජනා කරයි. කථන සංඥාවේ දක්නට ලැබෙන ලාක්ෂණික ධ්වනි සංසිද්ධි මත පදනම්ව විවිධ රෝග නිර්ණය කිරීම සම්බන්ධයෙන් ජෛව වෛද්‍ය ඉංජිනේරු විද්‍යාව පිළිබඳ පුළුල් දෙපාර්තමේන්තුවක් ඇත.

කථන සංඥාවක ධ්වනි විශ්ලේෂණයේ ප්‍රධාන අරමුණ කථිකයා හඳුනා ගැනීම හෝ ඔහු යැයි පවසන අය බව තහවුරු කිරීම (යතුර, මුරපදය හෝ PUK කේතය වෙනුවට හඬ) යෙදුම් ද ඇත. විශේෂයෙන්ම ස්මාර්ට් ගොඩනැගීමේ තාක්ෂණයන් සඳහා මෙය වැදගත් විය හැක.

කථන හඳුනාගැනීමේ පද්ධතියක පළමු අංගය වේ මයික්‍රෝෆෝනය. කෙසේ වෙතත්, මයික්‍රෆෝනය මගින් ලබා ගන්නා සංඥාව සාමාන්‍යයෙන් සුළු ප්‍රයෝජනයක් ලෙස පවතී. අධ්‍යයනවලින් පෙනී යන්නේ පුද්ගලයා, කථනයේ වේගය සහ අර්ධ වශයෙන් මැදිහත්කරුගේ මනෝභාවය අනුව ශබ්ද තරංගයේ හැඩය සහ ගමන් මග බොහෝ සෙයින් වෙනස් වන බවයි - කුඩා ප්‍රමාණයකට ඒවා කථන විධානවල අන්තර්ගතය පිළිබිඹු කරයි.

එබැවින්, සංඥාව නිවැරදිව සැකසිය යුතුය. නවීන ධ්වනි විද්‍යාව, ශබ්ද විද්‍යාව සහ පරිගණක විද්‍යාව එක්ව කථන සංඥාවක් සැකසීමට, විශ්ලේෂණය කිරීමට, හඳුනා ගැනීමට සහ තේරුම් ගැනීමට භාවිතා කළ හැකි පොහොසත් මෙවලම් කට්ටලයක් සපයයි. සංඥාවේ ගතික වර්ණාවලිය, ඊනියා ගතික වර්ණාවලීක්ෂ. ඒවා ලබාගැනීමට තරමක් පහසු වන අතර ගතික වර්ණාවලීක්ෂයක ස්වරූපයෙන් ඉදිරිපත් කරන කථනය රූප හඳුනාගැනීමේදී භාවිතා කරන තාක්ෂණික ක්‍රමවලට සමානව හඳුනාගැනීම සාපේක්ෂව පහසුය.

කථනයේ සරල අංග (උදාහරණයක් ලෙස, විධාන) සම්පූර්ණ වර්ණාවලිවල සරල සමානතාවයෙන් හඳුනාගත හැකිය. නිදසුනක් ලෙස, කටහඬින් සක්‍රිය කළ ජංගම දුරකථන ශබ්දකෝෂයක අඩංගු වන්නේ වචන සහ වාක්‍ය ඛණ්ඩ දස කිහිපයක් සිට සිය ගණනක් දක්වා පමණි, සාමාන්‍යයෙන් ඒවා පහසුවෙන් සහ කාර්යක්ෂමව හඳුනා ගත හැකි වන පරිදි පෙර ගොඩ ගසා ඇත. මෙය සරල පාලන කාර්යයන් සඳහා ප්රමාණවත් වේ, නමුත් එය සමස්ත යෙදුම දැඩි ලෙස සීමා කරයි. යෝජනා ක්රමයට අනුව ගොඩනගා ඇති පද්ධති, නීතියක් ලෙස, විශේෂයෙන් පුහුණු කරන ලද හඬවල් සඳහා විශේෂිත කථිකයන් පමණක් සහාය දක්වයි. එබැවින් පද්ධතිය පාලනය කිරීමට තම කටහඬ භාවිතා කිරීමට කැමති අලුත් කෙනෙකු සිටී නම්, ඔවුන් බොහෝ විට පිළිගන්නේ නැත.

මෙම මෙහෙයුමේ ප්රතිඵලය ලෙස හැඳින්වේ 2-W වර්ණාවලීක්ෂය, එනම් ද්විමාන වර්ණාවලියකි. මෙම කොටසෙහි අවධානය යොමු කළ යුතු තවත් ක්‍රියාකාරකමක් තිබේ - ඛණ්ඩනය. සාමාන්‍යයෙන් කථා කරන විට, අපි කතා කරන්නේ අඛණ්ඩ කථන සංඥාවක් වෙන වෙනම හඳුනාගත හැකි කොටස් වලට කැඩීම ගැන ය. සමස්තය හඳුනා ගැනීම සිදු වන්නේ මෙම පුද්ගල රෝග විනිශ්චය වලින් පමණි. මෙම ක්රියාපටිපාටිය අවශ්ය වන්නේ දිගු හා සංකීර්ණ කථාවක් එකවර හඳුනා ගැනීමට නොහැකි බැවිනි. කථන සංඥාවකින් වෙන්කර හඳුනාගත යුතු කොටස් පිළිබඳව සම්පූර්ණ වෙළුම් දැනටමත් ලියා ඇත, එබැවින් අපි කැපී පෙනෙන කොටස් ශබ්ද විකාශන (ශබ්ද සමාන), අක්ෂර හෝ සමහර විට ඇලෝෆෝන් විය යුතුද යන්න දැන් තීරණය නොකරමු.

ස්වයංක්‍රීය හඳුනාගැනීමේ ක්‍රියාවලිය සෑම විටම වස්තූන්ගේ සමහර ලක්ෂණ වලට යොමු වේ. කථන සංඥාව සඳහා විවිධ පරාමිති කට්ටල සිය ගණනක් පරීක්ෂා කර ඇත. කථන සංඥාව ඇත පිළිගත් රාමු වලට බෙදා ඇත සහ තිබීම තෝරාගත් විශේෂාංගමෙම රාමු හඳුනාගැනීමේ ක්‍රියාවලියේදී ඉදිරිපත් කර ඇති බැවින්, අපට සිදු කළ හැක (එක් එක් රාමුව සඳහා වෙන වෙනම) වර්ගීකරණය, i.e. රාමුවට හඳුනාගැනීමක් පැවරීම, අනාගතයේදී එය නියෝජනය කරනු ඇත.

ඊළඟ අදියර රාමු වෙනම වචන වලට එකලස් කිරීම - බොහෝ විට ඊනියා මත පදනම් වේ. ව්‍යංග මාර්කොව් මාදිලියේ ආකෘතිය (HMM-). එවිට වචන එකතුව පැමිණේ සම්පූර්ණ වාක්ය.

දැන් අපට මොහොතකට ඇලෙක්සා පද්ධතියට ආපසු යා හැක. ඔහුගේ උදාහරණය පුද්ගලයෙකුගේ යන්ත්‍ර "අවබෝධය" කිරීමේ බහු-අදියර ක්‍රියාවලියක් පෙන්වයි - වඩාත් නිවැරදිව: ඔහු විසින් දෙන ලද විධානයක් හෝ අසන ලද ප්‍රශ්නයක්.

වචන තේරුම් ගැනීම, අර්ථය තේරුම් ගැනීම සහ පරිශීලක අභිප්රාය තේරුම් ගැනීම සම්පූර්ණයෙන්ම වෙනස් දේවල් වේ.

එබැවින්, ඊළඟ පියවර වන්නේ එන්එල්පී මොඩියුලයේ () කාර්යයයි පරිශීලක අභිප්රාය හඳුනාගැනීම, i.e. එය ප්‍රකාශ කළ සන්දර්භය තුළ විධානයේ/ප්‍රශ්නයේ අර්ථය. අභිප්රාය හඳුනාගෙන තිබේ නම්, එසේ නම් ඊනියා කුසලතා සහ හැකියාවන් පැවරීම, එනම් ස්මාර්ට් සහකාර විසින් සහාය දක්වන විශේෂිත විශේෂාංගය. කාලගුණය පිළිබඳ ප්රශ්නයක දී, කාලගුණ දත්ත මූලාශ්ර කැඳවනු ලැබේ, එය කථාවට සැකසීමට ඉතිරිව ඇත (TTS - යාන්ත්රණය). ප්රතිඵලයක් වශයෙන්, පරිශීලකයා අසන ලද ප්රශ්නයට පිළිතුර අසයි.

හඬ? ග්‍රැෆික් කලා? නැත්නම් සමහරවිට දෙකම?

බොහෝ දන්නා නවීන අන්තර්ක්‍රියා පද්ධති පදනම් වී ඇත්තේ අතරමැදියෙකු මත ය චිත්රක පරිශීලක අතුරුමුහුණත (චිත්රක අතුරුමුහුණත). අවාසනාවකට, GUI යනු ඩිජිටල් නිෂ්පාදනයක් සමඟ අන්තර් ක්‍රියා කිරීමට වඩාත්ම පැහැදිලි ක්‍රමය නොවේ. මෙයට පරිශීලකයන් මුලින්ම අතුරු මුහුණත භාවිතා කරන ආකාරය ඉගෙන ගැනීම සහ එක් එක් පසුකාලීන අන්තර්ක්‍රියා සමඟ මෙම තොරතුරු මතක තබා ගැනීම අවශ්‍ය වේ. බොහෝ අවස්ථාවන්හිදී, කටහඬ වඩාත් පහසු වේ, මන්ද ඔබට උපාංගයට කථා කිරීමෙන් VUI සමඟ අන්තර් ක්‍රියා කළ හැකිය. ඇතැම් විධාන හෝ අන්තර්ක්‍රියා ක්‍රම මතක තබා ගැනීමට සහ මතක තබා ගැනීමට පරිශීලකයින්ට බල නොකරන අතුරු මුහුණතක් අඩු ගැටළු ඇති කරයි.

ඇත්ත වශයෙන්ම, VUI පුළුල් කිරීම යනු වඩාත් සාම්ප්‍රදායික අතුරුමුහුණත් අතහැර දැමීම නොවේ - ඒ වෙනුවට, අන්තර්ක්‍රියා කිරීමේ ක්‍රම කිහිපයක් ඒකාබද්ධ කරන දෙමුහුන් අතුරුමුහුණත් ලබා ගත හැකිය.

ජංගම සන්දර්භය තුළ සියලුම කාර්යයන් සඳහා හඬ අතුරු මුහුණත සුදුසු නොවේ. එය සමඟ, අපි මෝටර් රථයක් පදවන මිතුරෙකුට කතා කර ඔහුට කෙටි පණිවුඩයක් යවන්නෙමු, නමුත් නවතම මාරුවීම් පරීක්ෂා කිරීම ඉතා අපහසු විය හැකිය - පද්ධතියට සම්ප්‍රේෂණය වන තොරතුරු ප්‍රමාණය () සහ පද්ධතිය (පද්ධතිය) නිසා ජනනය වේ. Rachel Hinman ඇගේ Mobile Frontier පොතේ යෝජනා කරන පරිදි, ආදාන සහ ප්‍රතිදාන තොරතුරු ප්‍රමාණය කුඩා වන කාර්යයන් සිදු කිරීමේදී VUI භාවිතා කිරීම වඩාත් ඵලදායී වේ.

අන්තර්ජාලයට සම්බන්ධ ස්මාර්ට් ජංගම දුරකතනයක් පහසු නමුත් අපහසු වේ (9). පරිශීලකයෙකුට යමක් මිලදී ගැනීමට හෝ නව සේවාවක් භාවිතා කිරීමට අවශ්‍ය සෑම අවස්ථාවකම, ඔවුන්ට වෙනත් යෙදුමක් බාගත කර නව ගිණුමක් සෑදිය යුතුය. හඬ අතුරුමුහුණත් භාවිතය සහ සංවර්ධනය සඳහා ක්ෂේත්රයක් මෙහි නිර්මාණය කර ඇත. විවිධ යෙදුම් ස්ථාපනය කිරීමට හෝ එක් එක් සේවාව සඳහා වෙනම ගිණුම් සෑදීමට පරිශීලකයින්ට බල කිරීම වෙනුවට, විශේෂඥයින් පවසන්නේ VUI මෙම අපහසු කාර්යයන්හි බර AI බලයෙන් ක්‍රියාත්මක වන හඬ සහායක වෙත මාරු කරනු ඇති බවයි. වෙහෙස මහන්සි වී වැඩ කිරීමට ඔහුට පහසු වනු ඇත. අපි ඔහුට නියෝග පමණක් දෙන්නෙමු.

9. ස්මාර්ට් දුරකථනය හරහා හඬ අතුරු මුහුණත

අද දුරකථනයක් සහ පරිගණකයක් පමණක් නොව අන්තර්ජාලයට සම්බන්ධ වී ඇත. Smart thermostats, lights, kettles සහ තවත් බොහෝ IoT-ඒකාබද්ධ උපාංග ජාලයට සම්බන්ධ කර ඇත (10). මේ අනුව, අපගේ ජීවිත පුරවන රැහැන් රහිත උපාංග අප වටා ඇත, නමුත් ඒවා සියල්ලම චිත්‍රක පරිශීලක අතුරුමුහුණතට ස්වභාවිකව නොගැලපේ. VUI භාවිතා කිරීම ඔබට ඒවා පහසුවෙන් අපගේ පරිසරයට ඒකාබද්ධ කිරීමට උපකාරී වේ.

10. Internet of Things සමඟ හඬ අතුරු මුහුණත

හඬ පරිශීලක අතුරුමුහුණතක් නිර්මාණය කිරීම ඉතා ඉක්මනින් ප්‍රධාන නිර්මාණකරුවන්ගේ කුසලතාවයක් බවට පත්වනු ඇත. මෙය සැබෑ ගැටළුවකි - හඬ පද්ධති ක්‍රියාත්මක කිරීමේ අවශ්‍යතාවය, ක්‍රියාශීලී නිර්මාණය කෙරෙහි වැඩි අවධානයක් යොමු කිරීමට ඔබව දිරිමත් කරනු ඇත, එනම්, පරිශීලකයාගේ ආරම්භක අභිප්‍රායන් තේරුම් ගැනීමට උත්සාහ කිරීම, සංවාදයේ සෑම අදියරකදීම ඔවුන්ගේ අවශ්‍යතා සහ අපේක්ෂාවන් අපේක්ෂා කිරීම.

Voice යනු දත්ත ඇතුළත් කිරීමට කාර්යක්ෂම ක්‍රමයකි—එය පරිශීලකයින්ට ඔවුන්ගේම කොන්දේසි මත පද්ධතියට ඉක්මනින් විධාන නිකුත් කිරීමට ඉඩ සලසයි. අනෙක් අතට, තිරය තොරතුරු ප්‍රදර්ශනය කිරීමට කාර්යක්ෂම ක්‍රමයක් සපයයි: එය පද්ධතිවලට එකවර විශාල තොරතුරු ප්‍රමාණයක් ප්‍රදර්ශනය කිරීමට ඉඩ සලසයි, පරිශීලකයින්ගේ මතකයේ බර අඩු කරයි. ඒවා එක් පද්ධතියකට ඒකාබද්ධ කිරීම දිරිගන්වන සුළු බව තාර්කික ය.

Amazon Echo සහ Google Home වැනි ස්මාර්ට් ස්පීකර් කිසිසේත්ම දෘශ්‍ය සංදර්ශකයක් ලබා නොදේ. මධ්‍යස්ථ දුරින් කටහඬ හඳුනාගැනීමේ නිරවද්‍යතාවය සැලකිය යුතු ලෙස වැඩිදියුණු කිරීම, ඔවුන් හෑන්ඩ්ස්-ෆ්‍රී ක්‍රියාකාරිත්වයට ඉඩ සලසයි, එමඟින් ඔවුන්ගේ නම්‍යශීලී බව සහ කාර්යක්ෂමතාව වැඩි කරයි - දැනටමත් හඬ පාලනයක් සහිත ස්මාර්ට්ෆෝන් ඇති පරිශීලකයින් සඳහා පවා ඒවා යෝග්‍ය වේ. කෙසේ වෙතත්, තිරයක් නොමැතිකම විශාල සීමාවකි.

හැකි විධානයන් පිළිබඳව පරිශීලකයින්ට දැනුම් දීමට බීප් පමණක් භාවිතා කළ හැකි අතර, ප්‍රධාන කාර්යයන් හැර ප්‍රතිදානය ශබ්ද නඟා කියවීම වෙහෙසකර වේ. ඉවුම් පිහුම් කරන අතරතුර හඬ විධානයක් සහිත ටයිමරයක් සැකසීම විශිෂ්ටයි, නමුත් කොපමණ කාලයක් ඉතිරිව ඇත්දැයි ඔබෙන් විමසීම අවශ්‍ය නොවේ. සාමාන්‍ය කාලගුණ අනාවැකියක් ලබා ගැනීම පරිශීලකයාට මතකයේ පරීක්ෂණයක් බවට පත් වේ, ඔහුට බැලූ බැල්මට ඒවා තිරයෙන් ලබා ගැනීමට වඩා සතිය පුරා කරුණු මාලාවකට සවන් දීමට සහ අවශෝෂණය කිරීමට සිදු වේ.

නිර්මාණකරුවන් දැනටමත් ඇත දෙමුහුන් විසඳුම, Echo Show (11), එය මූලික Echo ස්මාර්ට් ස්පීකරයට සංදර්ශක තිරයක් එක් කළේය. මෙය උපකරණවල ක්රියාකාරිත්වය බෙහෙවින් පුළුල් කරයි. කෙසේ වෙතත්, Echo Show තවමත් ස්මාර්ට්ෆෝන් සහ ටැබ්ලට් පරිගණකවල දිගුකාලීනව පවතින මූලික කාර්යයන් ඉටු කිරීමේ හැකියාව බෙහෙවින් අඩුය. එයට (තවමත්) වෙබයේ සැරිසැරීමට, සමාලෝචන පෙන්වීමට හෝ ඇමේසන් සාප්පු කරත්තයක අන්තර්ගතය පෙන්වීමට නොහැකිය.

දෘශ්‍ය සංදර්ශකයක් යනු මිනිසුන්ට ශබ්දයට වඩා තොරතුරු සම්භාරයක් ලබා දීමේ වඩාත් ඵලදායී ක්‍රමයකි. හඬ ප්‍රමුඛතාවයෙන් නිර්මාණය කිරීම කටහඬ අන්තර්ක්‍රියා විශාල වශයෙන් වැඩිදියුණු කළ හැකි නමුත්, දිගුකාලීනව, අන්තර්ක්‍රියා සඳහා දෘශ්‍ය මෙනුව අත්තනෝමතික ලෙස භාවිතා නොකිරීම, එක් අතකින් ඔබේ පිටුපසට බැඳගෙන සටන් කිරීම හා සමාන වනු ඇත. අන්තයේ සිට අවසානය දක්වා බුද්ධිමත් හඬ සහ සංදර්ශක අතුරුමුහුණත්වල සංකීර්ණත්වය හේතුවෙන්, සංවර්ධකයින් අතුරු මුහුණත් සඳහා දෙමුහුන් ප්‍රවේශයක් බැරෑරුම් ලෙස සලකා බැලිය යුතුය.

කථන උත්පාදනය සහ හඳුනාගැනීමේ පද්ධතිවල කාර්යක්ෂමතාව සහ වේගය වැඩි කිරීම එවැනි යෙදුම් සහ ක්ෂේත්‍රවල ඒවා භාවිතා කිරීමට හැකි වී ඇත, උදාහරණයක් ලෙස:

• හමුදා (ගුවන් යානා හෝ හෙලිකොප්ටර් වල හඬ විධාන, උදාහරණයක් ලෙස, F16 VISTA),

• ස්වයංක්‍රීය පෙළ පිටපත් කිරීම (කථනයෙන් පෙළට),

• අන්තර්ක්‍රියාකාරී තොරතුරු පද්ධති (ප්‍රධාන කථනය, හඬ ද්වාර),

• ජංගම උපාංග (දුරකථන, ස්මාර්ට් ෆෝන්, ටැබ්ලට්),

• රොබෝ තාක්ෂණය (Cleverbot - ASR පද්ධති කෘතිම බුද්ධිය සමඟ ඒකාබද්ධව),

• වාහන (Blue & Me වැනි මෝටර් රථ උපාංගවල දෑත් රහිත පාලනය),

• නිවාස යෙදුම් (ස්මාර්ට් නිවාස පද්ධති).

ආරක්ෂාව ගැන විමසිල්ලෙන් සිටින්න!

මෝටර් රථ, ගෘහ උපකරණ, උණුසුම/සිසිලනය සහ ගෘහ ආරක්ෂණ පද්ධති සහ ගෘහ උපකරණ රාශියක් බොහෝ විට AI මත පදනම් වූ හඬ අතුරුමුහුණත් භාවිතා කිරීමට පටන් ගෙන ඇත. මෙම අවස්ථාවෙහිදී, යන්ත්‍ර සමඟ මිලියන ගණනක සංවාද වලින් ලබාගත් දත්ත යවනු ලැබේ පරිගණක වලාකුළු. අලෙවිකරුවන් ඔවුන් ගැන උනන්දු වන බව පැහැදිලිය. ඔවුන් පමණක් නොවේ.

Symantec ආරක්ෂක විශේෂඥයින්ගේ මෑත වාර්තාවක් නිර්දේශ කරන්නේ හඬ විධාන භාවිතා කරන්නන් නිවසේ ආරක්ෂක පද්ධති තබා දොර අගුල් වැනි ආරක්ෂක විශේෂාංග පාලනය නොකරන ලෙසයි. මුරපද හෝ රහස්‍ය තොරතුරු ගබඩා කිරීම සඳහාද එය එසේම වේ. කෘතිම බුද්ධිය සහ ස්මාර්ට් නිෂ්පාදනවල ආරක්ෂාව තවමත් ප්‍රමාණවත් ලෙස අධ්‍යයනය කර නොමැත.

නිවස පුරා ඇති උපාංග සෑම වචනයකටම සවන් දෙන විට, පද්ධතිය අනවසරයෙන් ඇතුළුවීමේ අවදානම සහ අනිසි භාවිතය විශාල සැලකිල්ලක් දක්වයි. ප්‍රහාරකයෙකු දේශීය ජාලයට හෝ ඊට සම්බන්ධ විද්‍යුත් තැපැල් ලිපින වෙත ප්‍රවේශය ලබා ගන්නේ නම්, ස්මාර්ට් උපාංග සැකසීම් වෙනස් කිරීමට හෝ කර්මාන්තශාලා සැකසීම් වෙත යළි පිහිටුවීමට හැකිය, එමඟින් වටිනා තොරතුරු නැතිවීමට සහ පරිශීලක ඉතිහාසය මකා දැමීමට හේතු වේ.

වෙනත් වචන වලින් කිවහොත්, හඬින් ක්‍රියාත්මක වන AI සහ VUI තවමත් අපව විභව තර්ජන වලින් ආරක්ෂා කර ගැනීමට සහ ආගන්තුකයෙකු යමක් ඉල්ලා සිටින විට අපගේ කටවල් වසා ගැනීමට තරම් බුද්ධිමත් වී නොමැති බවට ආරක්ෂක වෘත්තිකයන් බිය වෙති.

අදහස් එක් කරන්න