Abtak Media Google News

સ્પીચ રેકોગ્નિશન માટેનું એક નોંધપાત્ર પગલું ૧૯૭૧માં મંડાયું. સ્પીચ અંડરસ્ટેંડિંગ રિસર્ચ પ્રોગ્રામમાં આઇબીએમ, કારનેજી મેલોન યુનિવર્સિટી અને સ્ટાંફોર્ડ રિસર્ચ સંસ્થાએ જુસ્સાભેર ભાગ લીધો, પરિણામે હાર્પીનો જન્મ થયો: આ હાર્પી પાસે હવે ૧૦૦૦ જેટલા શબ્દોનું ભંડોળ હતું

અલેક્સા.. પ્લે સમ મ્યુઝિક… જેમની પાસે હશે એને ખબર હશે કે રોજ ઓફિસ થી ઘરે થાકેલા આવી ને મગજ ને આરામ આપવા આજ ઉદગાર નીકળે છે. દરેક ને મન માં એક એવી મહત્વાકાંક્ષા હોય કે કોઈ એના હુકમો નું પાલન કરે. જે લોકો ઓફિસ માં હુકમ ના ચલાવી શકતા હોય તેઓ ઘરે આવી ને અલેક્સા, ગૂગલ અસિસ્ટેંટ કે પછી સિરી પાસે પોતાનો હુકમ ચલાવતા હોય છે. ખબર જ છે કે એ કોઈ દિવસ સામે હાકલ નહીં પાડે. કોઈ વાર એવી રમુજ થઈ જાય જ્યારે આ વર્ચુયલ અસિસ્ટેંટ ને આપણી વાત માં ગતાગમ ના પડી હોય. કોઈ વાર અર્થ નો અનર્થ પણ થઈ જાય! મુખ્ય વસ્તુ તો એ છે કે આ બધી વાતો એના ડેટા-બેસ માં સ્ટોર થાય છે.

એક સમય એવો હતો કે સવારે છાપું હાથ માં લઈ ને કે ટેબલ જેવડા રેડિયો માં આકાશવાણી ના પ્રોગ્રામ ની રાહ જોવાતી. એકદમ ચીવટ વડે રેડિયો ના નોબ ને ખરર… ખરર… ના અવાજ માથી લતા મંગેશકર ના અવાજ માં બદલવાની એક અલગ જ મજા હતી. એ સમયે સૌથી સ્માર્ટ એ રેડિયો જ હતો. સવાર-સાંજ દૂર બેઠેલા વ્યક્તિ ના અવાજ ને આ પાસે પડેલ ડબ્બો સંભળાવે તો તેના કરતાં સ્માર્ટ બીજું શું હોય?

પરંતુ જે મિડાસ નો સ્પર્શ દરેક વસ્તુ ને સોનું બનાવી દેતો તેમ મનુષ્ય ને દરેક વસ્તુ માં જીવ પૂરવો બહુ ગમે. આ કારણે આ પોતાની ઇચ્છા મુજબ વગડ્યા કરે તેવો રેડિયો કે સ્પીકર જામે નહીં. આપણે તો કઈક એવું જોઈએ જે આપણું સાંભળે ખરી અને સામો જવાબ પણ આપે. સામાજિક પ્રાણી એવા મનુષ્ય ને વાત કરવા માણસ નહીં તો મશીન જોઈએ. આ સાથે એક એવા અસિસ્ટેંટ ની જરૂર જણાઈ જે ઘર ના ઉપકરણો સાથે આપડી વાત કરાવે.

મશીન આપણી ભાષા સમજી શકે એવા સ્માર્ટ બનાવવા ની શરૂઆત ૧૯૬૧ માં આઇબીએમ એ કરી. તેમનું આ અસિસ્ટેંટ આઇબીએમ શૂબોક્સ પહેલું ડિજિટલ સ્પીચ રેકોગ્નિશન ટૂલ બન્યું. આ શૂ બોક્સ ૧૬ શબ્દો અને અંકો ને સમજી શકતું. આઇબીએમ ના ઇજનેર વિલિયમ સી. દેર્ષ એ આ મશીન બનાવ્યું હતું. આઇબીએમ શૂબોક્સ આંકડાઓ સાથે પ્લસ, માઇનસ એવા શબ્દો ને સમજી ને સામાન્ય ગણતરીઓ કરી શકતું. પણ ૧ મિનટ… આ સ્પીચ રેકોગ્નિશન નો ખ્યાલ આવ્યો ક્યાથી?

વોઇસ ઇસ ધ ફ્યુચર જોર્રિટ વન દર મેઉલેન (જે એમેઝોન ડિવાઇસ અને અલેક્સા યુરોપ ના વાઇસ પ્રેસિડેંટ છે) એવું માને છે કે અવાજ થી ઓપરેટ થતાં મશીન વાપરવા સૌથી સરળ છે. આ જ ખ્યાલ માં ભવિષ્ય વસેલું છે. તેમના આ વિચાર ને લાગતો આવે એવો વિચાર ૧૭૭૩ માં પણ થયો હતો. કલ્પના કરો કે એવો સમય જ્યારે ઇન્ટરનેટ કે કમ્પ્યુટર નું નામ નહોતું ત્યારે રુસ ના વૈજ્ઞાનિક શ્રી ક્રિશ્ચિયન ક્રત્જેન્સ્ટેન એ એક એવું વિચિત્ર મશીન બનાવ્યું હતું જે મનુષ્ય ના અવાજ જેવા સ્વરો ઉત્પન્ન કરી શકતું હતું. રેઝોનન્સ ટ્યૂબ અને ઓર્ગન પાઇપ દ્વારા બનાવેલ તે વિશ્વ નું સૌથી પહેલું બોલતું મશીન હતું. જો એ સમય પ્રમાણે વિચારીએ તો કેવી કળા કે એક નિર્જીવ મશીન પણ અવાજ કાઢે છે! ત્યાર બાદ વર્ષ ૧૯૦૭ માં ગ્રેહામ બેલ દ્વારા ડિક્ટાફોન બનાવવા માં આવ્યો જે મનુષ્ય ના અવાજ ને રેકોર્ડ કરી શકતો હતો. પરંતુ આ બધા મશીન પેસીવ હતા. જેમ આગળ કહ્યું તેમ મનુષ્ય ને તો વાત કરવા જોઈએ! અને તેના માટે મશીન એ માણસ નું બોલેલું સાંભળી ને સમજવું પણ પડે.

સમજણા કહી શકાય એવા મશીન ની શરૂઆત ૧૯૫૨ માં થઈ. બેલ લેબોરેટરી દ્વારા ઔડરે નામનું મશીન બન્યું. છ ફૂટ ઊંચી રેક માં મઢેલ આ મશીન ધ્વનિ ના મૂળભૂત અંકો જેને અંગ્રેજી માં ફોનેમ્સ કહેવાય તેને ઓળખી શકતું. એક વાસ્તવિક ઢબે પહેલું એવું મશીન બન્યું જે મનુષ્ય ના અવાજ ને ફક્ત રેકોર્ડ નહીં પરંતુ ઓળખતું. એ સમય માં કમ્પ્યુટર તો રજવાડા નો વટ હતા અને આજ ની જેમ આમતેમ સહેલાઈ થી ફેરવી શકાય તેમ પણ નહોતા. તેમછતાં, ઔડરે એક એવું મશીન બન્યું જે શૂન્ય થી નવ સુધી ના અંકો ને ૯૦ ટકા ચોકસાઇ થી ઓળખી શકતું. તે સમયે આ આંકડાઓ ઓળખતું મશીન ફક્ત ફોન માં નંબર લગાવવા ઉપયોગ માં લઈ શકાતું. બોલી ને ફોન લગાવવા કરતાં નંબર ના બટન દબાવવા સહેલા પડે. આ કારણે એક મહત્વ નું ગણી શકાય તેવું સંશોધન પણ એટલું ઉપયોગી ન બની શક્યું.

આ બાદ ૧૯૬૦ માં જાપાન ના વૈજ્ઞાનિકો એ મનુષ્ય ની બોલી ને ઓળખી શકે એવા મશીન માટે પ્રયોગો શરૂ કર્યા. ક્રમશ: આઇબીએમ શૂબોક્સ બન્યું જેમાં પ્લસ અને માઇનસ બોલવાથી સરવાળા બાદબાકી થતાં હતા. સ્પીચ રેકોગ્નિશન માટે નું એક નોંધપાત્ર પગલું ૧૯૭૧ માં મંડાયું. યુએસ ની ડિફેન્સ રિસર્ચ એજન્સિ દરપાએ સ્પીચ અંડરસ્ટેંડિંગ રિસર્ચ પ્રોગ્રામ માટે નાણાં રોક્યા. આ પ્રોગ્રામ માં આઇબીએમ, કારનેજી મેલોન યુનિવર્સિટી અને સ્ટાંફોર્ડ રિસર્ચ સંસ્થા એ જુસ્સાભેર ભાગ લીધો. પરિણામે હાર્પીનો જન્મ થયો. આ હાર્પી પાસે હવે ૧૦૦૦ જેટલા શબ્દો નું ભંડોળ હતું. આ હાર્પી એટલું સફળ હતું કે તે આપણે બોલેલા શબ્દો ને સ્પીચ ટુ ટેક્સ્ટ અને ટેક્સ્ટ ટુ મશીન ટ્રાન્સલેશન કરી શકતું. ત્યાર બાદ આ રેલગાડી પુર પાટે દોડી.

Img 20210219 Wa0010

અલેક્સા બેન… વાત તો કરો..

વર્ષ ૨૦૧૭ માં અમઝોન એ સૌપ્રથમ ભારત માં સ્માર્ટ સ્પીકર નું વહેચાણ શરૂ કર્યું. વર્ષ ૨૦૨૦ ના અંત સુધી માં ભારત માં ૭,૫૦,૦૦૦ સ્માર્ટ સ્પીકર વહેચાયા. હવે સ્માર્ટ સ્પીકર ફક્ત સંગીત જ નથી સંભળાવતા, પરંતુ ઘર ના લાઇટ – પંખા તથા બીજા ઉપકરણો ને પણ કંટ્રોલ કરે છે. આજ નું વાતાવરણ, તાપમાન, તમારી સમયસારણી, અલાર્મ અને બીજું શું નહીં… આ સ્માર્ટ વર્ચુયલ અસિસ્ટેંટ ફક્ત સ્પીકરમાથી ખૂબ આગળ વધી ને આર્ટિફિશ્યલ ઇન્ટેલીજન્સ ના ઘડતર હેઠળ આપણને નવી નવી સુવિધાઓ આપતા થયા છે. હવે તો આ સ્માર્ટ સ્પીકર લોકલ ભાષા પણ સમજવા માંડ્યા છે. અહી એક વાત નોંધવી ખરી કે જો તમારા ઘર માં સ્વિચ ઓન કરેલ સ્માર્ટ સ્પીકર હોય તો તેના કાન હમેશા ખુલ્લા હોય છે. તમે તેને જે પણ કહો છો તે બધુ જ તે અમેઝોન ના ક્લાઉડ સર્વર માં સ્ટોર કરે છે. આ તમારી ઓડિઓ ફાઇલ તમારી પસંદ ની વસ્તુઓ પીરસવા માટે વપરાઇ છે. તમે રોજ જે પણ વાત અલેક્સા કે ગૂગલ અસિસ્ટેંટ ને કહો છો તે સંગ્રહી ને પ્રોસેસ થાય છે. આ કારણે જ તમારી પસંદ વિશે તમારી વર્ચુયલ અસિસ્ટેંટ અચૂક વાકેફ હશે.

આપણે હમેશા જ્યારે ભવિષ્ય ના વિકસિત વિજ્ઞાન થી સભર વર્ષ ૨૦૫૦ કે ૨૦૬૦ વિશે કલ્પના કરીએ છીએ ત્યારે આપણને સાંભળી ને જવાબ દેતા મશીનની જરૂર થી કલ્પના કરીએ છીએ. ઘર ના બધા જ ઉપકરણો થી માંડી ને આપણાં દરેક કામ એક અવાજ કરતાં કોઈ મશીન કરી દે એવી સહુ ને ઇચ્છા થાય છે. જો ભવિષ્ય માં આર્ટિફિશ્યલ ઇન્ટેલીજન્સ ખૂબ જ વિકસિત થઈ ગયું તો કદાચ આપણે આપની સંવેદનાઓ પણ એક માનવસર્જિત સજીવ પાસે વ્યક્ત કરી શકીશું.

લે સાચ્ચે માં?

  • અલેક્સા તમારા હુકમ થી છીંક પણ ખાઈ શકે છે. ફક્ત કહો કે ‘અલેક્સા, કેન યૂ સ્નીઝ?’
  • અલેક્સા તમને સુવડવા માટે સ્નોર પણ કરી શકે છે.
  • ગૂગલ અસિસ્ટેંટ ની મદદ થી તમે ખોવાયેલ વસ્તુ ને શોધી શકો છો.  વારંવાર ભૂલી જતી વસ્તુ પર ફક્ત એક ટાઇલ ટ્રેકર નામનું ડિવાઇસ લગાવી દો.

© 2011 - 2024 Abtak Media. Designed by ePaper Solution.