یکی از قابلیتهای کلیدی که رقبای مایکروسافت آن را بههر زحمتی پیاده کردهاند و در ویندوز8 دیده نمیشود، سیستم تشخیص گفتار هوشمند و هوشیار است که در سیستمعامل جدید ویندوز جایی ندارد.
آیپدها و آیفونها با قراردادن دکمه تشخیص گفتار در کیبوردشان مستقیما از این قابلیت پشتیبانی میکند و گوگل نیز شیوه کنترل از طریق صوت خود را در اندروید 4 قرار داده است، اما چرا این قابلیت در ویندوز8 دیده نمیشود؟
میتوان با نگاه به دیگر لپتاپها، دسکتاپها یا رایانههای مک به این نتیجه رسید که این فناوری هنوز وارد حوزه رایانههای رومیزی نشده و بیشتر در دنیای موبایل باقی مانده است.
در ویندوز8 (همانند ویندوز7 و ویستا) سیستم تشخیص گفتار تنها بهدرد معلولان میخورد و هدفی فراتر از آن ندارد. سیستم تشخیص گفتار ویندوز در نسخههای ویستا و ویندوز7 نیز به کاربران اجازه میداد با استفاده از صدا، برخی فعالیتهای سیستمعامل را کنترل کنند.
همانند ویندوز7، ویندوز8 نیز پیشرفتهای قابل توجهی نسبت به نسخه پیشین خود داشته است، اما نشان میدهد مایکروسافت نمیخواهد این فناوری را به بخش مهمی از ویندوز تبدیل کند. اگر از میکروفن استفاده کنید، ویندوز8 صدای شما را میشناسد و دستورهای ساده را دریافت میکند، اما هیچ کار دیگری نمیتواند انجام دهد و بههیچ عنوان نمیتواند دستیار شخصی یک فرد باشد. کاری که Siri بخوبی در اپل انجام میدهد.
فرصت از دسترفته
مایکروسافت همیشه آنقدر به سیستمهای کنترل از طریق صدا بیتوجه نبوده است. این شرکت بزرگ تولیدکننده نرمافزار در ویندوز ویستا WSR را معرفی کرد. در آن زمان بسیار جذاب بود که همه کاربران میتوانستند با رایانههای خود حرف بزنند. این شرکت همچنین قابلیتی با عنوان ماکرو در WSR قرار داده بود که رایانه میتوانست با دریافت دستور از کاربر، مجموعهای از کارها را انجام دهد. متاسفانه این قابلیت، کارهای پیشفرض انجام نمیداد و کاربران مجبور بودند خودشان تکتک ماکروهای مورد نظرشان را بنویسند. از WSR بیشتر کاربران حرفهای استفاده میکردند.
مایکروسافت همچنین شرکت متخصص در سیستمهای تشخیص گفتار TellMe را سال 2007 خریداری کرد و از آن فناوری برای تشخیص فرمانهای ویندوز استفاده کرد. البته اصل فناوری TellMe در ویندوز فون7 و 8 استفاده شد.
تاثیر Siri
اگر با Siri کار کرده باشید، قطعا میدانید نخستین تجربه کار با آن عجیب است. این نرمافزار تنها گفتار را به متن تبدیل نمیکند و پنجره بازکن نیست. در حقیقت، ابزار پیشرفتهتری است که میتوان لقب دستیار شخصی را به آن داد. این نرمافزار تقریبا متوجه لهجهها بیشتر میشود و میتواند بسیاری از کارهایی را که به منشیمان میگوییم، انجام دهد.
ارسال و دریافت پیامهای متنی، برقراری تماس صوتی، نوشتن ایمیل، حفظ تاریخ قرارها، یادآوری آنها و... از کارهایی است که این نرمافزار انجام میدهد. همچنین هنگام جستجو در اینترنت، سیری ابتدا سوال را درک میکند و بعد جواب را نشان میدهد: سوال، آخر هفته هوا بارانی است؟ باعث میشود سیری با درک سوال، نتیجه پیشبینی آب و هوای روزهای آخر هفته را نشان دهد.
اپل و گوگل در تلاشند بهترین سیستم تشخیص معنای گفتار را تولید کنند، این در حالی است که مایکروسافت میتواند وارد این بازار پرطرفدار، اما نهچندان پیشرفته شود و با عرضه سیستم تشخیص گفتار درست و حسابی در ویندوز8، قدرت این سیستمعامل را چند برابر کند. در حقیقت اگر مایکروسافت بتواند این قابلیت را به ویندوز8 وارد کند، بهصورت خودکار از دیگران جلوخواهد زد؛ زیرا این فناوری هنوز در رایانههای رومیزی دیده نشده است. این قابلیت همچنین میتواند همان عامل تشویقکنندهای باشد که کاربران محتاط ویندوزهای 7 و اکسپی را برای انتقال به ویندوز8 راضی نکرده است.
تولیدکنندگان لپتاپ و دسکتاپ نیز میتوانند از این قابلیت بهرهمند شوند. این صنعت از هر اقدامی که باعث حفظ مشتریانش شود، حمایت میکند؛ زیرا هر روز دارندگان تبلتها بیشتر میشوند و تمایل به خرید رایانههای رومیزی کمتر.
متاسفانه تولیدکنندگان PC معتقدند مشتریان عموما خواهان این هستند که سیستمها را روی گوشیهای تلفنهمراه خود داشته باشند و بهدنبال استفاده از کیبورد در رایانههای رومیزی هستند.
بیشتر گروههای محقق در زمینه کنترل صوت برای خدمت بهتر به دنیای موبایل و دستگاههای آن شکل میگیرد.
صدا در اولترابوک
شاید اینتل زودتر از مایکروسافت به نتیجه برسد. این شرکت در همکاری با Nuance درصدد تولید نرمافزار تشخیص صوت برای اولترابوک است. این نرمافزار که Dragon Assistant نام دارد، روی رایانه اجرا میشود و میتواند با نرمافزارهای مختلف برای انجام کارهایی از قبیل پخش موسیقی، نوشتن ایمیل، وبگردی و تماشای ویدئو بهکار بیاید.
نوانس در حال حاضر در بازار تشخیص صدا یکی از پیشروها به شمار میرود. گفته میشود، نوانس بخش عمدهای از توسعه نرمافزار Siri را بر عهده داشته است. این شرکت همچنین سیستم VR را برای شرکت ماشینسازی فورد توسعه داده است.
این فناوری قرار است در پلتفرم اولترابوکهای اینتل نیز قرار بگیرد.
نوانس در ابتدا با عرضه Dragon Naturally Speaking وارد این صنعت شد که بهترین نرمافزار دیکته در بازار بهشمار میرفت. این برنامه همچنین برای افراد معلول نیز قابل استفاده بود و بخصوص در مرور وب بخوبی خودش را نشان میداد.
این شرکت اعلام کرده است تمایل زیادی به تولید نرمافزاری مشابه Siri در لپتاپها و دسکتاپها دارد. معاون و مدیر داخلی نوانس، مت رویس معتقد است موفقیت این فناوری در بخش موبایل باعث میشود انتظارها برای چنین نرمافزاری در دسکتاپ و لپتاپها بالا برود.
رویس همچنین نبود نرمافزار دستیار شخصی در ویندوز8 را دریچهای برای رشد و رقابت شرکتهای جانبی میداند. اما او معتقد است یکپارچگی درون سیستمعامل به نرمافزارهای خارجی ارجحیت دارد؛ زیرا در این صورت کنترل بیشتری در اختیار کاربر خواهد بود.
اما رویس معتقد است بیش از 80 درصد کارهای روزمره هماکنون در Dragon Assistant وجود دارد. این موضوع شامل ارتباط با نرمافزارهای دیگر از جمله پخش موسیقی از طریق یک نرمافزار صوتی میشود.
اگر اینتل و نوانس بتوانند سیستم تشخیص صوت را در پلتفرم اولترابوکهای اینتل بگنجانند، در این صورت فشارها و تقاضا برای حضور چنین فناوری در خود سیستمعامل نیز بیشتر خواهد شد.
محمدرضا قربانی