সুচিপত্র:
- গুগলের অ্যালগরিদম এইভাবে কাজ করে
- প্রসঙ্গটি বিবেচনায় নিয়ে স্বয়ংক্রিয় সংশোধন
- আমরা পিক্সেলটিতে এই প্রযুক্তিটি দেখতে পাব
গুগল এবং এমআইটি থেকে গবেষকরা একটি অ্যালগরিদম তৈরি করেছেন যা প্রশস্ত-কোণ শটগুলির ত্রুটিগুলি সংশোধন করতে চায়।
আপনি হয়ত দেখেছেন যে কিছু লোকের মুখগুলি প্রসারিত, সামান্য স্কোয়াশ বা ফটোতে কিছুটা বিকৃতিযুক্ত দেখায়। যদিও এটি ফটোগ্রাফারের কয়েকটি দক্ষতার কারণে হতে পারে, সত্যতা হ'ল মোবাইল ডিভাইসগুলি থেকে প্রশস্ত-কোণ লেন্সযুক্ত শটগুলি সাধারণত বস্তু বা চিত্রের প্রান্তে থাকা লোকগুলিতে বিকৃতি ঘটায়।
বিভিন্ন সমস্যা রয়েছে যা এই সমস্যাটি সমাধান করার চেষ্টা করে তবে এখন পর্যন্ত কোনওটি গুগলের নতুন প্রস্তাবের মতো কার্যকর হয়নি। এটি ঠিক করা সহজ বলে মনে হলেও এটি এমনটি নয়, কারণ এতে জটিল স্থানীয় সম্পাদনা দরকার যা ফটোতে থাকা বাকী অবজেক্টগুলিকে প্রভাবিত করে না।
গুগলের অ্যালগরিদম এইভাবে কাজ করে
গবেষকরা যেমন ব্যাখ্যা করেছেন, এই অ্যালগরিদম মুখগুলি সনাক্ত করে এবং একটি জাল তৈরি করে যা চিত্রের মধ্যে বর্ণিত একটি প্রশস্ত কোণ দিয়ে শট নেওয়ার সময় এই ধরণের বিকৃতিটি স্বয়ংক্রিয়ভাবে বিপরীত করতে দেয়:
নিম্নলিখিত চিত্রগুলিতে এই অ্যালগরিদম প্রয়োগ করার সময় আমরা পার্থক্যটি বলতে পারি। এটি একটি সেলফি যা একটি 97 angle ক্ষেত্রের দর্শন সহ প্রশস্ত এঙ্গেল লেন্সের সাথে নেওয়া হয়েছিল।
প্রথম চিত্রটি মুখগুলির বিকৃতি দেখায় এবং দ্বিতীয়টি দেখায় যে কীভাবে অ্যালগরিদম মুখের আকারগুলিকে তাদের মূল অবস্থায় ফিরিয়ে আনল।
অর্থাৎ, প্রশস্ত-কোণ লেন্সগুলি ব্যবহার করার সময়, মুখগুলিতে এই বিশেষ সহায়তা সরবরাহ করার পরে, তবে বাকী চিত্রটিতে কোনও পরিবর্তন না ঘটায় এই প্রক্রিয়াটি স্বয়ংক্রিয়ভাবে সক্রিয় হয় । এবং অবশ্যই, এই স্বয়ংক্রিয় সংশোধনের গতি (প্রায় 920 মিলিসেকেন্ড) ব্যবহারকারীদের এটি সনাক্ত করা অসম্ভব করে তোলে।
তাদের পরীক্ষাগুলি অনুসারে, এই অ্যালগরিদমটি মোবাইল ডিভাইস থেকে প্রায় সমস্ত সম্ভাবনা কভার করে দেখার ক্ষেত্রে 70 70 থেকে 120 ° এর পরিসরে সাফল্যের সাথে কাজ করে।
এই অ্যালগরিদমের সম্ভাব্যতার সুযোগ নিতে, ব্যবহারকারীর কোনও পদক্ষেপ নিতে বা কোনও বিশেষ ক্যামেরা মোড সক্রিয় করতে হবে না। এই ফাংশনটি তখনই স্বয়ংক্রিয়ভাবে প্রয়োগ করা হবে যখন এটি সনাক্ত করে যে প্রশস্ত কোণ লেন্স ব্যবহৃত হয়েছে।
প্রসঙ্গটি বিবেচনায় নিয়ে স্বয়ংক্রিয় সংশোধন
আমরা নিম্নলিখিত ভিডিওতে এই অ্যালগরিদমের গতিশীলতা দেখতে পারি:
অ্যালগরিদম স্বয়ংক্রিয়ভাবে দৃশ্যে উপস্থিত বাকী অবজেক্টগুলিকে বিবেচনায় নিয়ে সংশোধন করে ফটোগুলির পুরো প্রসঙ্গে মেলে তা নিশ্চিত করে। ফলাফলগুলি বিবরণ ছাড়াই প্রাকৃতিক যা দেখায় যে ফটোগ্রাফটি একেবারেই সংশোধিত হয়েছে।
এই প্রকল্পের পেছনের দলটি ফ্লিকারে একটি ফটো গ্যালারী ভাগ করেছে যা দেখায় যে বিভিন্ন পদ্ধতি কীভাবে তাদের অ্যালগোরিদমের গতিশীলতার তুলনায় এই সমস্যাটির সমাধান করে। 160 টিরও বেশি ফটোগ্রাফ রয়েছে (যেমন আপনি নিবন্ধের শুরুতে দেখছেন) যা ফলাফলগুলি মূল্যায়নে সহায়তা করে।
আমরা পিক্সেলটিতে এই প্রযুক্তিটি দেখতে পাব
আমরা আশা করতে পারি যে এই অ্যালগরিদম বা কিছু উত্পন্ন প্রযুক্তি পিক্সেলের পরবর্তী প্রজন্মের জন্য প্রয়োগ করা হবে, যেহেতু এই প্রকল্পে অংশ নেওয়া দলটি গুগল কর্মী।
তবে তারা যে দস্তাবেজটি ভাগ করেছেন তাতে তারা এ সম্পর্কে কিছু উল্লেখ করেনি। অ্যালগরিদমের ক্রিয়াকলাপের এই প্রথম পরীক্ষাগুলি আবারও সফলভাবে দেখিয়েছে যে কীভাবে কৃত্রিম বুদ্ধিমত্তার সম্ভাবনা মোবাইল ডিভাইসগুলির গতিশীলতা উন্নত করতে এবং ব্যবহারকারীদের জীবনকে সহজতর করে তুলতে পারে।
নিঃসন্দেহে, আমাদের মোবাইল ডিভাইসে একটি অনুরূপ গতিশীল থাকার ফলে ফটোগ্রাফগুলিতে এই বিকৃতিগুলি সম্পাদনা করার প্রচুর মাথা ব্যথা এবং সময় সাশ্রয় হবে।
