ঢাকা ০৮:২৯ পূর্বাহ্ন, শনিবার, ২৭ জুলাই ২০২৪, ১২ শ্রাবণ ১৪৩১ বঙ্গাব্দ
সংবাদ শিরোনাম
বাংলাদেশের পরিস্থিতি নিয়ে বিদেশি মিডিয়া কী বলছে? দিল্লিতে মুখপাত্রের ব্রিফিং, মমতার মন্তব্যে কড়া প্রতিক্রিয়া, বাংলাদেশে দ্রুত শান্তির প্রত্যাশা কবে ট্রেন চলবে এখনো সিদ্ধান্ত হয়নি : রেলের ডিজি বাংলাদেশ ব্যাংকের হ্যাক হওয়া ওয়েবসাইট উদ্ধার হয়েছে গুলিতে নিহিত আবু সাঈদের জন্য কাদছে পীরগঞ্জের মানুষ নিহত-আহতদের পূর্ণাঙ্গ তালিকা প্রকাশের দাবি সিপিবি’র আন্দালিব রহমান পার্থকে ডিবি পরিচয়ে তুলে নেয়ার অভিযোগ এখনই খুলছে না স্কুল-কলেজ, মৃতের সংখ্যা ২০০ ছাড়াল! জারি থাকছে কার্ফু, ধৃত ১৭৫৮ আগামীতে আইসিটি সেক্টরে ১০ লক্ষ কর্মসংস্থান সৃষ্টি করা হবে ………….ঠাকুরগাঁওয়ে আইসিটি প্রতিমন্ত্রী পীরগঞ্জে বিদায় সংবর্ধনা ও দায়িত্বভার গ্রহণ শেখ সমশের আলী

কণ্ঠস্বর নকলের প্রযুক্তিতে অপরাধীদের পোয়াবারো?

আন্তর্জাতিক ডেস্ক::বিজ্ঞান ও প্রযুক্তি যতই উন্নত হচ্ছে, ততই নানা পেশা ও নানা কাজ যন্ত্রনির্ভর করে তোলার দৌঁড় বাড়ছে। এর মধ্যে জনপ্রিয় ও সফল হয়ে উঠেছে কণ্ঠস্বর হুবহু নকলের প্রযুক্তি, যাতে আকৃষ্ট হচ্ছেন ভয়েস আর্টিস্টরা। কিন্তু কেন এ প্রযুক্তির উদ্ভাবন, অভিনেতা বা ভয়েস আর্টিস্টদের জন্য এটা কী সুসংবাদ না দুঃসংবাদ, আর সাইবার অপরাধীদের জন্যই বা এটা কত বড় সুযোগ- এসব ব্যাখ্যা করেছেন বিবিসির বাণিজ্য বিষয়ক সংবাদদাতা কিট্টি পালমাই।

যুক্তরাষ্ট্রের টেক্সাসে ভয়েস আর্টিস্ট এবং অভিনেতা হিসাবে কাজ করেন টিম হেলার। তিনি যখন তার কণ্ঠস্বরের নকল বা ক্লোন প্রথম শোনেন, তিনি বলেন, এটা এতটাই সঠিক ছিল যে বিস্ময়ে ‘আমার চোয়াল মাটিতে গিয়ে ঠেকেছিল। অবিশ্বাস্যরকম মিল দেখে আমার মাথা ঘুরে গিয়েছিল।’

কীভাবে করা হয় ভয়েস ক্লোনিং : কারো কণ্ঠ ক্লোন বা হুবহু নকল করা হয় কম্পিউটারে কৃত্রিম বুদ্ধিমত্তার একটি সফটওয়্যার প্রোগ্রাম ব্যবহার করে, যার মাধ্যমে একজন ব্যক্তির কণ্ঠস্বর হুবহু নকল করে একটা কৃত্রিম কণ্ঠস্বর তৈরি করা হয়। এর জন্য কাউকে মাত্র কয়েক মিনিট তার কণ্ঠের রেকর্ডিং করে দিতে হয়। এর থেকেই সফটওয়্যার জেনে যায় তার কণ্ঠের আওয়াজ, তার বাচনভঙ্গি- কীভাবে ওই ব্যক্তি কথা বলেন।

শুধু আপনার কণ্ঠের আওয়াজই নয়, এ প্রযুক্তি সাম্প্রতিক সময়ে এতটাই এগিয়েছে যে আপনি শুনলে টের পাবেন না যে আপনার কণ্ঠের যান্ত্রিক অনুকরণ আপনি শুনছেন। আপনার কথা বলার ঢং, আপনার অ্যাকসেন্ট বা কথার উচ্চারণভঙ্গি, আপনি কত দ্রুত বা ধীরে কথা বলেন, কথা বলার সময় আপনার কণ্ঠ কতটা ওঠে বা নামে, শব্দের মাঝে আপনি যেভাবে শ্বাস নেন এবং গলার স্বর আপনার কতটা হালকা বা গম্ভীর – সবই এ সফটওয়্যার হুবহু নকল করে ফেলে।

এই সফটওয়্যারের চমকে দেবার মত আরও ক্ষমতা আছে। আপনার কণ্ঠস্বরের সব বিশেষত্ব জেনে নেয়ার পর আপনি যখন কম্পিউটারের কীবোর্ডে কোন শব্দ বা বাক্য লিখবেন, সেটা কম্পিউটার হুবহু আপনার গলার আওয়াজে উপস্থাপন করবে – অর্থাৎ শুনলে মনে হবে আপনিই সরাসরি কথা বলছেন।

শুধু তাই নয়, আপনার নকল কণ্ঠস্বরে দরকার হলে নানা ধরনের আবেগও ফুটিয়ে তুলতে পারবে এই সফটওয়্যার – যেমন রাগ, ভয়, আনন্দ, প্রেম, বিরহ বা বিরক্তি।

নকল কন্ঠস্বর তৈরির এই ব্যবসা এখন বেশ রমরমা হয়ে উঠছে। এরকম একটি প্রতিষ্ঠানের নাম ভোকালআইডি- তাদের কোম্পানি যুক্তরাষ্ট্রের বোস্টন শহরে।

কেন এই প্রযুক্তির উদ্ভাবন : ভোকালআইডি প্রতিষ্ঠানটি তৈরি করেছেন রুপাল প্যাটেল। তিনি সংস্থাটির প্রধান নির্বাহী। তিনি নর্থইস্টার্ন ইউনিভার্সিটির যোগাযোগ বিজ্ঞান ও এ সংক্রান্ত সমস্যা বিষয়ে অধ্যাপক।

রুপাল প্যাটেল এই ব্যবসা গড়ে তোলেন ২০১৪ সালে তার চিকিৎসা কাজকে আরও এগিয়ে নেবার লক্ষ্যে। যেসব রোগী অসুস্থতার কারণে বা অস্ত্রোপচারের পর কথা বলার ক্ষমতা হারিয়েছে, তাদের কণ্ঠস্বর যন্ত্রের সাহায্যে কৃত্রিমভাবে তৈরি করার তাগিদ থেকে এই প্রযুক্তির ওপর ভিত্তি করে তিনি তার সংস্থাটি প্রতিষ্ঠা করেন।

তিনি বলেন, এই প্রযুক্তি কাজ করে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টালিজেন্স (এআই) সফটওয়্যার ব্যবহার করে। কী প্রয়োজন সেটা ‘বুঝতে পারার’ ক্ষমতা এআই-এর আছে এবং সেটা বুঝে এআই নিজেই ঠিক করে নেয় তার কাছে কী চাওয়া হচ্ছে।

অধ্যাপক প্যাটেল বলছেন, গত কয়েক বছরে এই প্রযুক্তি অনেক উন্নত হয়েছে এবং মানুষের কণ্ঠস্বর হুবহু নকল করতে পারছে। তিনি বলছেন, এখন শুধু কণ্ঠস্বর হারানো রোগী নয়, তার খদ্দেরদের মধ্যে রয়েছেন ভয়েসওভার শিল্পীরা। সূত্র : বিবিসি

Tag :

ভিডিও

এই অথরের আরো সংবাদ দেখুন

Azam Rehman

জনপ্রিয় সংবাদ

বাংলাদেশের পরিস্থিতি নিয়ে বিদেশি মিডিয়া কী বলছে?

কণ্ঠস্বর নকলের প্রযুক্তিতে অপরাধীদের পোয়াবারো?

আপডেট টাইম ০৪:১৩:০৬ অপরাহ্ন, মঙ্গলবার, ১৩ জুলাই ২০২১
আন্তর্জাতিক ডেস্ক::বিজ্ঞান ও প্রযুক্তি যতই উন্নত হচ্ছে, ততই নানা পেশা ও নানা কাজ যন্ত্রনির্ভর করে তোলার দৌঁড় বাড়ছে। এর মধ্যে জনপ্রিয় ও সফল হয়ে উঠেছে কণ্ঠস্বর হুবহু নকলের প্রযুক্তি, যাতে আকৃষ্ট হচ্ছেন ভয়েস আর্টিস্টরা। কিন্তু কেন এ প্রযুক্তির উদ্ভাবন, অভিনেতা বা ভয়েস আর্টিস্টদের জন্য এটা কী সুসংবাদ না দুঃসংবাদ, আর সাইবার অপরাধীদের জন্যই বা এটা কত বড় সুযোগ- এসব ব্যাখ্যা করেছেন বিবিসির বাণিজ্য বিষয়ক সংবাদদাতা কিট্টি পালমাই।

যুক্তরাষ্ট্রের টেক্সাসে ভয়েস আর্টিস্ট এবং অভিনেতা হিসাবে কাজ করেন টিম হেলার। তিনি যখন তার কণ্ঠস্বরের নকল বা ক্লোন প্রথম শোনেন, তিনি বলেন, এটা এতটাই সঠিক ছিল যে বিস্ময়ে ‘আমার চোয়াল মাটিতে গিয়ে ঠেকেছিল। অবিশ্বাস্যরকম মিল দেখে আমার মাথা ঘুরে গিয়েছিল।’

কীভাবে করা হয় ভয়েস ক্লোনিং : কারো কণ্ঠ ক্লোন বা হুবহু নকল করা হয় কম্পিউটারে কৃত্রিম বুদ্ধিমত্তার একটি সফটওয়্যার প্রোগ্রাম ব্যবহার করে, যার মাধ্যমে একজন ব্যক্তির কণ্ঠস্বর হুবহু নকল করে একটা কৃত্রিম কণ্ঠস্বর তৈরি করা হয়। এর জন্য কাউকে মাত্র কয়েক মিনিট তার কণ্ঠের রেকর্ডিং করে দিতে হয়। এর থেকেই সফটওয়্যার জেনে যায় তার কণ্ঠের আওয়াজ, তার বাচনভঙ্গি- কীভাবে ওই ব্যক্তি কথা বলেন।

শুধু আপনার কণ্ঠের আওয়াজই নয়, এ প্রযুক্তি সাম্প্রতিক সময়ে এতটাই এগিয়েছে যে আপনি শুনলে টের পাবেন না যে আপনার কণ্ঠের যান্ত্রিক অনুকরণ আপনি শুনছেন। আপনার কথা বলার ঢং, আপনার অ্যাকসেন্ট বা কথার উচ্চারণভঙ্গি, আপনি কত দ্রুত বা ধীরে কথা বলেন, কথা বলার সময় আপনার কণ্ঠ কতটা ওঠে বা নামে, শব্দের মাঝে আপনি যেভাবে শ্বাস নেন এবং গলার স্বর আপনার কতটা হালকা বা গম্ভীর – সবই এ সফটওয়্যার হুবহু নকল করে ফেলে।

এই সফটওয়্যারের চমকে দেবার মত আরও ক্ষমতা আছে। আপনার কণ্ঠস্বরের সব বিশেষত্ব জেনে নেয়ার পর আপনি যখন কম্পিউটারের কীবোর্ডে কোন শব্দ বা বাক্য লিখবেন, সেটা কম্পিউটার হুবহু আপনার গলার আওয়াজে উপস্থাপন করবে – অর্থাৎ শুনলে মনে হবে আপনিই সরাসরি কথা বলছেন।

শুধু তাই নয়, আপনার নকল কণ্ঠস্বরে দরকার হলে নানা ধরনের আবেগও ফুটিয়ে তুলতে পারবে এই সফটওয়্যার – যেমন রাগ, ভয়, আনন্দ, প্রেম, বিরহ বা বিরক্তি।

নকল কন্ঠস্বর তৈরির এই ব্যবসা এখন বেশ রমরমা হয়ে উঠছে। এরকম একটি প্রতিষ্ঠানের নাম ভোকালআইডি- তাদের কোম্পানি যুক্তরাষ্ট্রের বোস্টন শহরে।

কেন এই প্রযুক্তির উদ্ভাবন : ভোকালআইডি প্রতিষ্ঠানটি তৈরি করেছেন রুপাল প্যাটেল। তিনি সংস্থাটির প্রধান নির্বাহী। তিনি নর্থইস্টার্ন ইউনিভার্সিটির যোগাযোগ বিজ্ঞান ও এ সংক্রান্ত সমস্যা বিষয়ে অধ্যাপক।

রুপাল প্যাটেল এই ব্যবসা গড়ে তোলেন ২০১৪ সালে তার চিকিৎসা কাজকে আরও এগিয়ে নেবার লক্ষ্যে। যেসব রোগী অসুস্থতার কারণে বা অস্ত্রোপচারের পর কথা বলার ক্ষমতা হারিয়েছে, তাদের কণ্ঠস্বর যন্ত্রের সাহায্যে কৃত্রিমভাবে তৈরি করার তাগিদ থেকে এই প্রযুক্তির ওপর ভিত্তি করে তিনি তার সংস্থাটি প্রতিষ্ঠা করেন।

তিনি বলেন, এই প্রযুক্তি কাজ করে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টালিজেন্স (এআই) সফটওয়্যার ব্যবহার করে। কী প্রয়োজন সেটা ‘বুঝতে পারার’ ক্ষমতা এআই-এর আছে এবং সেটা বুঝে এআই নিজেই ঠিক করে নেয় তার কাছে কী চাওয়া হচ্ছে।

অধ্যাপক প্যাটেল বলছেন, গত কয়েক বছরে এই প্রযুক্তি অনেক উন্নত হয়েছে এবং মানুষের কণ্ঠস্বর হুবহু নকল করতে পারছে। তিনি বলছেন, এখন শুধু কণ্ঠস্বর হারানো রোগী নয়, তার খদ্দেরদের মধ্যে রয়েছেন ভয়েসওভার শিল্পীরা। সূত্র : বিবিসি