বাংলা ইউনিকোডের আন্তর্জাতিক স্বীকৃতির ইতিবৃত্ত

ছবি সংগৃহীত

বাংলা ইউনিকোডের আন্তর্জাতিক স্বীকৃতির ইতিবৃত্ত

প্রিয় টেক
লেখক

প্রকাশিত: ১৯ জুলাই ২০১৪, ১৪:৪৯
আপডেট: ১৯ জুলাই ২০১৪, ১৪:৪৯

(প্রিয় টেক) দীর্ঘ অপেক্ষার পর যুক্তরাষ্ট্র ভিত্তিক আন্তর্জাতিক প্রতিষ্ঠান ইউনিকোড কনসোর্টিয়াম (বাংলাদেশের মান বিডিএস ১৫২০:২০১১) বাংলা ইউনিকোডকে স্বীকৃতি দিয়েছে। বাংলাদেশ কম্পিউটার কাউন্সিলের নির্বাহী পরিচালক আশরাফ আহমদ গত ১৫ জুলাই এ তথ্য গণমাধ্যমকে জানিয়েছেন। এই স্বীকৃতির ফলে ইউনিকোডে লেখা বাংলা ভাষা আন্তর্জাতিক অঙ্গনে আরও একধাপ এগিয়ে গেল। এর আগে ইউনিকোড কনসোর্টিয়াম প্রতিষ্ঠার প্রায় ২৩ বছর পর বাংলাদেশ ইউনিকোড কনসোর্টিয়ামের সদস্য হয়েছিল ২০১০ সালের ৩০ জুন। ইউনিকোডের নানান দিক নিয়ে বিশ্লেষণ করেছেন এম. মিজানুর রহমান সোহেল

ইউনিকোড কনসোর্টিয়াম
ইউনিকোড কনসোর্টিয়াম হলো মার্কিন যুক্তরাষ্ট্রে অবস্থিত একটি অলাভজনক সংস্থা। এর সূচনা ১৯৮৬ সালে হলেও এর জন্ম ১৯৮৭ সালে। ১৯৮৮ সালে এটি মোটামুটি একটি রূপ পরিগ্রহ করে। ১৯৯১ সালের জানুয়ারিতে ইউনিকোড ইনকর্পোরেটেড হয়। র‌্যাংক জেরক্সের জো বেকার এবং অ্যাপলের লি কলিন্স ও মার্ক ডেভিস প্রাথমিক আলোচনার মধ্য দিয়ে ইউনিকোডের যাত্রা শুরু করেন। মূলত র‌্যাংক জেরক্স ও অ্যাপলের উদ্যোগ হলেও এটি এখন সারা দুনিয়ার ভাষাসমূহের ডিজিটাল যন্ত্রের মান নির্ণয় করে থাকে। মূলত ইউনিকোড কনসোর্টিয়াম তৈরী হয়েছে ইউনিকোড বৈশিষ্ট্যের উন্নয়ন, ব্যবহার এবং বিস্তার করার জন্য, যেটা আধুনিক সফটওয়্যার এবং বৈশিষ্ট্যর প্রতিনিধিত্ব করে। এই কনসোর্টিয়ামের সদস্যপদ গ্রহণকারীরা কম্পিউটার তথ্য প্রক্রিয়াকারী শিল্পের কর্পরেশন বা সংগঠনে তথ্য বিস্তৃতি করার জন্য বোর্ড হিসেবে দায়িত্ব পালন করে। সদস্যদের চাঁদার মাধ্যমে এই কনসোর্টিয়াম চালিত হয়। পৃথিবীর যে-কোনো স্থানের ব্যক্তি বা সংগঠনের পক্ষে ইউনিকোড কনসোর্টিয়ামের সদস্যপদ গ্রহণকরা সম্ভব, যারা ইউনিকোডের বৈশিষ্ট্যে অনুকরণ করে, ইউনিকোডের প্রসারণ বা ব্যবহারিকতা বাড়াতে চায়। বিশ্বের ছোট বড় সকল ভাষাকে কম্পিউটারে কোডভুক্ত করার জন্য ইউনিকোড ব্যবহৃত হয়। ইহা মূলতঃ ২ বাইট বা ১৬ বিটের কোড (Unicode Transformation Format-16 or UTF-16)। এই কোডের মাধ্যমে ৬৫,৫৩৬ টি অদ্বিতীয় চিহ্নকে নির্দিষ্ট করা যায়। ফলে যে সমস্ত ভাষাকে কোডভুক্ত করার জন্য ৮ বিট অপর্যাপ্ত ছিল (চাইনিজ, কোরিয়ান, জাপানিজ ইত্যাদি) সে সকল ভাষার সকল চিহ্নকে সহজেই কোডভুক্ত করা সহজতর হয়েছে। বিশ্বের প্রতিটি প্রধান ভাষার বর্ণমালার জন্য ইউনিকোড এ নির্দিষ্ট মান আছে। আর এই মান নির্ধারণের কাজটি করে ইউনিকোড কনসোর্টিয়াম। কম্পিউটার সিস্টেমে কোনো ভাষালিপির এনকোডিং আন্তর্জাতিকভাবে স্বীকৃত না হলে সেই ভাষায় ইন্টারনেটে বিশ্বব্যাপী তথ্য বিনিময় করা যায় না। এ মূহুর্তে বাংলা ভাষালিপি ইউনিকোডে অন্তর্ভূক্ত হওয়ায় কমপিউটারে সহজেই বাংলা ভাষা লেখা, তথ্য বিনিময় ছাড়াও বাড়তি সুবিধা পাওয়া সম্ভব হবে। চীনা, জাপানি, স্প্যানিশ, হিন্দি ইত্যাদি ভাষার মানুষেরা দীর্ঘদিন থেকে কমপিউটারে নিজ ভাষা ব্যবহারের সুবিধা পেয়ে আসছে।

ইউনিকোড কী?
ইউনিকোড হচ্ছে বিশ্বব্যাপী স্বীকৃত আন্তর্জাতিক বর্ণ সংকেতায়ন ব্যবস্থা। ইউনিকোড কনসোর্টিয়াম সংস্থা এর রক্ষণাবেক্ষণের দায়িত্ব পালন করে। যেকোন প্রতিষ্ঠান বা ব্যক্তি ফি দিয়ে সংস্থাটির সদস্য হতে পারে। বর্তমানে ইউনিকোডে ১০,০০০ এর বেশি বর্ণ তালিকাভুক্ত রয়েছে। বিশ্বের প্রায় সব প্রধান কম্পিউটার সফ্টওয়্যার ও হার্ডওয়্যার প্রতিষ্ঠানসমূহ সংস্থাটির বর্তমান সদস্য, যেমন Apple Computer, Microsoft, IBM, Xerox, HP, Adobe Systems এবং আরও অনেক প্রতিষ্ঠান যারা টেক্সট্-প্রসেসিং স্ট্যান্ডার্ড সম্পর্কে আগ্রহী। ইউনিকোড কনসোটিয়াম একটি অলাভজনক সংগঠন যেটি ইউনিকোডের উন্নয়নে কাজ করে যাচ্ছে এই সংগঠনের মূল লক্ষ হচ্ছে সকল ভাষাকে একটি নির্দিষ্ট মানদন্ডে নিয়ে আসা। কম্পিউটারে লিপি বা অন্যান্য অক্ষর সংরক্ষিত হয় সেই অক্ষরগুলির প্রতিটির পিছনে একটি করে একক সংখ্যা দিয়ে। ইউনিকোড আবিষ্কার হওয়ার আগে কম্পিউটারে ব্যবহারের জন্য শত শত লিপিসংকেত ছিলো ঐ একক সংখ্যা হিসাবে ব্যবহারের জন্য। একটি লিপিসংকেতের পক্ষে সব অক্ষরের সমর্থন দেয়া সম্ভব ছিলো না: যেমন, ইউরোপিয় ইউনিয়েনেরই অনেকরকম লিপিসংকেতের প্রয়োজন হত তাদের সব ভাষাকে সমর্থন দেয়ার জন্য। এমনকি ইংরেজির মতো একটি ভাষার স্বাভাবিক ব্যবহারের ক্ষেত্রেও একটিমাত্র লিপিসংকেত দিয়ে অক্ষর, বিরাম চিহ্ন এবং কারিগরি অক্ষরগুলির সমর্থন দেয়া সম্ভব হতো না। সবচেয়ে বড় সমস্যা ছিলো যে ঐ লিপিসংকেতগুলি একটি আরেকটির সাথে ঝামেলা করত বা এখনও করে। কারণ দু'টি লিপিসংকেতে দু'টি আলাদা অক্ষরের জন্য একই সংখ্যা ব্যবহার করা হয় অথবা একই অক্ষরের জন্য আলাদা আলাদা সংখ্যা ব্যবহার করা হয়। যার জন্য, যে-কোনো কম্পিউটার (বিশেষ করে সার্ভার)-এ অনেকগুলি লিপিসংকেতের সমর্থনের প্রয়োজন হয়ে দাঁড়ায়; তার পরেও বিভিন্ন লিপিসংকেত বা প্লাটফর্মের ডাটা প্রসেস করার সময় সেটা বিকৃত হয়ে যাবার ভয় থেকেই যায়।

ইউনিকোডের ইতিবৃত্ত
১৯৮৭ সালে ইউনিকোডের কাজ শুরু করেছিলেন জেরোক্স (Xerox) এর জো বেকার (Joe Becker) এবং অ্যাপল (Apple) এর লি কলিন্স (Lee Collins) ও মার্ক ডেভিস (Mark Davis)। তাঁদের মূল লক্ষ্য ছিল সকল ভাষাকে একটি সার্বজনীন সংকেতায়নের মানদন্ডে নিয়ে আসা।ফলশ্রুতিতে পরবর্তী বছরের আগষ্ট মাসে জো বেকার "International/multilingual text character encoding system, tentatively called Unicode." (অনুবাদ: "আন্তর্জাতিক/বহুভাষিক বর্ণ সংকেতায়ন ব্যবস্থা") নামে একটি খসড়া প্রস্তবনা তৈরি করেন। এই প্রস্তাবনাটি ছিল একটি ১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থা: ‘Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.’ ১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থার কারণ ছিল তিনি মনে করেছিলেন শুধুমাত্র আধুনিক ভাষার বর্ণগুলি ব্যবহৃত হবে। ‘Unicode gives higher priority to ensuring utility for the future than to preserving past antiquities. Unicode aims in the first instance at the characters published in modern text (e.g. in the union of all newspapers and magazines printed in the world in 1988), whose number is undoubtedly far below 214 = 16,384. Beyond those modern-use characters, all others may be defined to be obsolete or rare; these are better candidates for private-use registration than for congesting the public list of generally-useful Unicodes.’ পরবর্তীতে অনেক পুরাতন ভাষার জন্য ও তালিকাভুক্ত করার প্রয়োজন পড়ে। এদের মাঝ এমন ভাষাও রয়েছে যেগুলি বর্তমানে আর ব্যবহৃত হয় না। (যেমন: মিশরীয় চিত্রলিপি, লিনিয়ার-এ, লিনিয়ার-বি ইত্যাদি)। ১৯৮৯ সালে মেটাফোর (Metaphor)-এর কেন হুইস্লার (Ken Whistler) এবং মাইক কার্নাগান (Mike Kernaghan), আর.এল.জি (RLG)-এর ক্যারেন স্মিথ-ইয়োশিমুরা (Karen Smith-Yoshimura) ও জোয়ান আলিপ্র্যান্ড (Joan Aliprand) এবং সান মাইক্রোসিস্টেমস্ (Sun Microsystems)-এর গ্লেন্ রাইট (Glenn Wright) ইউনিকোডের গ্রুপে যোগদান করেন। পরবর্তীতে ১৯৯০ সালে মাইক্রোসফ্ট (Microsoft)-এর মিচেল সুইগনার্ড (Michel Suignard) ও অ্যাস্মাস ফ্রেইট্যাগ (Asmus Freytag) এবং NeXT এর রিক ম্যাকগোয়ান (Rick McGowan) যোগদান করেন। ১৯৯০ সালের শেষের দিকে ইউনিকোডের খসড়া প্রস্তাবনা সম্পন্ন হয়। ১৯৯১ এর অক্টবরে ইউনিকোডের প্রথম খন্ড প্রকাশিত হয়। ১৯৯২ সালের জুনে ইউনিকোডের দ্বিতীয় খন্ড প্রকাশিত হয়।

ইউনিকোড শব্দটির উৎপত্তি
ইতিহাসের পাতায় চোখ রাখলে জানা যাবে, ইউনিকোড শব্দটির উৎপত্তি জো বেকারের হাতে। তিনি from unique, universal, and uniform character encoding এর বিবেচনায় এই নামটি রাখেন। বস্তুত এর প্রথম মানটি তৈরি করার কাজ শুরু হয় ১৯৮৬ সালে। কিন্তু সে সংস্করণটি প্রস্তুত করতে সময় লাগে ৬ বছর। তাই ১৯৯২ সালের জুনে প্রথম সংস্করণটি প্রকাশিত হয়। এর মাঝে ইউনিকোডের ৫টি সংস্করণ প্রকাশিত হয়েছে। ২০১০ সালের জুলাই মাসে ইউনিকোডের ৫.২ সংস্করণ অনুমোদিত হয়। ইউনিকোড ওয়েবসাইট থেকে পাওয়া তথ্য অনুসারে এর ৬.০ সংস্করণের জন্য মোট ১,০৯,২৪১টি গ্রাফিক্স, ১৪২টি ফরমেট, ৬৫টি কন্ট্রোল, ১৩৭৪৬৮ টি ব্যক্তিগত ব্যবহার, সারোগেট ২০৪৮, নন ক্যারেক্টার ৬৬ এবং ৮,৬৫,০৮২ টি সংরক্ষিত কোড রয়েছে। এতে ২০৮৭টি নতুন অক্ষর যোগ করা হয়েছে। তিনটি নতুন লেখন পদ্ধতি যুক্ত হয়েছে, যার মাঝে একটি হচ্ছে ব্রাহ্মী-বাংলালিপির উৎপত্তিস্থল। বলা যেতে পারে, প্রতিটি সংস্করণেই এর ব্যাপক উন্নয়ন সাধিত হয় এবং বিশ্বের ভাষাসমূহ ডিজিটাল যুগে ব্যবহার হবার নতুন নতুন প্রযুক্তির সন্ধান পায়। সবচেয়ে উল্লেখযোগ্য বিষয় হলো, বিশ্ব মান সংস্থা আইএসও ডিজিটাল যন্ত্রের মান নির্ণয়ে শুধু এই সংস্থাটির সাথেই কাজ করে।

কম্পিউটারের আদি ভাষা রোমান
কম্পিউটারের যারা আদি ব্যবহারকারী তারা জানেন, এই ডিজিটাল যন্ত্রটি একেবারে শুরুতে রোমান হরফ ছাড়া আর কোনো হরফ বুঝত না। কম্পিউটারের আন্তর্জাতিক প্রথম কোড ছিলো ১২৮টি। ০ থেকে ১২৭ পর্যন্ত বিস্তৃত এই কোডমালায় শুধু রোমান হরফ। সোজা কথায় শুধু রোমান হরফের মূল অক্ষরগুলো লেখা যেতো। ইংরেজি ছাড়া অন্য ভাষার বর্ণগুলোও তাতে লেখা যেত না। এরপর এ সংখ্যা বাড়িয়ে করা হয় ২৫৬টি। প্রথম ১২ কে আসকি ও পরের ১২৮সহ ২৫৬টিকে বলা হয় এক্সটেন্ডেড আসকি। ইউনিকোড মান জন্ম নেবার আগে পর্যন্ত এই মোট ২৫৬টি কোড দিয়ে কমপিউটারে লেখা যেত। কোন কোনো যন্ত্র, যেমন ফটোটাইপসেটার এর বাইরের কোড ব্যবহার করলেও সেইসবের কোনো মান ছিল না। এ কারণেই রোমান হরফ যারা ব্যবহার করে না তারা ছাড়া অন্য কারও পক্ষে তাদের নিজের ভাষা কমপিউটারে লেখা সম্ভব ছিল না। র‍্যাঙ্ক জেরক্স কোম্পানি সেই ২৫৬টি কোডসীমা অতিক্রম করার চেষ্টা করলেও একই সমান কোড বহাল রেখে রোমান ভাষার পাশাপাশি অন্য ভাষা ব্যবহারের সহজ সুযোগ আসে ১৯৮৪ সালে জন্ম নেয়া মেকিন্টোস কমপিউটারে। ১৯৮১ সালে জন্ম নেয়া আইবিএম পিসির জন্য প্রণীত ডস অপারেটিং সিস্টেমেও রোমান হরফের কোড সীমানায় অন্য ফন্ট এবং সেই সুবাদে অন্য ভাষা ব্যবহার করা যেতো। কিন্তু প্রক্রিয়াটি জটিল ছিলো বলে অ্যাপল কম্পিউটার কোম্পানির মেকিন্টোস কম্পিউটার ডেস্কটপ বিপক্ষে অগ্রনায়কের ভূমিকা পালন করে।

ইউনিকোডের বৈশিষ্ট্য
ইউনিকোড পৃথিবীর প্রতিটি ভাষার প্রতিটি অক্ষরের জন্য একটি একক সংখ্যা বরাদ্দ করছে, সেটা যে প্লাটফর্মের জন্যই হোক, যে প্রোগ্রামের জন্যই হোক, আর যে ভাষার জন্যই হোক। ইউনিকোডের এই বৈশিষ্ট্য প্রযুক্তিশিল্পে নেতৃত্ব দিচ্ছে এরকম কোম্পানিগুলি যেমন, Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys সহ অনেকেই গ্রহণ করেছে। আধুনিক বৈশিষ্ট্যের ব্যবহারের জন্য যেমন, XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, ইত্যাদি, ইউনিকোডের প্রয়োজন, এবং এই ইউনিকোডই ISO/IEC 10646-এর প্রয়োগের একমাত্র উপায়। অনেক অপারেটিং সিস্টেমে, নতুন সব ইন্টারনেট ব্রাউজারে এবং এরকম অনেক অ্যাপ্লিকেশনে ইউনিকোডের সমর্থন রয়েছে। ইউনিকোড বৈশিষ্টের উত্থান, একে সমর্থন করে এরকম টুলের উপস্থিতি, বর্তমান বিশ্বের সফটওয়্যার উন্নতির গতির জন্য গুরুত্বপুর্ণ। বিশাল লিপিসংকেতের সমর্থন থাকায় ক্লায়েন্ট সার্ভার বা বহুমুখী এ্যপ্লিকেশন এবং ওয়েবের গঠনে পুরোনো লিপিমালার ব্যবহার না করে ইউনিকোডের ব্যবহার অনেক খরচ কমিয়ে আনতে পারে। ইউনিকোড কোনো বাড়তি প্রকৌশল ছাড়াই একটি সফটওয়্যার বা ওয়েবসাইটকে বিভিন্ন প্লাটফর্ম, ভাষা এবং দেশে ব্যবহারযোগ্যতা দেয়। এটা ব্যবহারের ফলে ডাটা বিভিন্ন সিস্টেমের মধ্যে দিয়ে আনাগোনা করতে পারে কোনো রকম বিকৃতি ছাড়াই।

ইংরেজি ভাষায় টাইপের চার তরিকা
ব্যক্তিগত বা দাপ্তরিক প্রয়োজনে আমরা প্রায়শই কোন-না কোন চিঠি, নথিপত্র কিংবা দলিলাদি কম্পিউটারে বাংলা অথবা ইংরেজি ভাষায় টাইপকরে (যাকে আমরা কম্পিউটার কম্পোজ বলি) ব্যবহার করি। কখনো-কখনো আবার বিভিন্ন সামাজিক সাইটে স্ট্যাটাস প্রদান বা ই-মেইলও করে থাকি। অপারেটিং সিস্টেম (যেমনঃ উইন্ডোজ এক্সপি/ভিসতা/সেভেন অথবা লিনাক্স) ইন্সটল করা নতুন একটি সক্রিয় কম্পিউটারে বাংলা অথবা ইংরেজি ভাষায় টাইপ করতে হলে বা কম্পিউটারটি টাইপিং –এর উপযোগী করতে হলে ব্যবহারকারীকে কয়েকটি বিষয় বিবেচনায় আনতে হবে। অন্যথায় কম্পিউটারে মার্তৃভাষা কিংবা অন্য কোন ভাষায় টাইপিং কার্যক্রম সম্পাদন করা সম্ভব নয়। একটি কম্পিউটারকে বাংলা অথবা ইংরেজী লিখার জন্য উপযোগী করতে হলে চারটি বিষয় বিবেচনায় আনা প্রয়োজন। প্রথমত, টেক্সট এডিটর বা ওয়ার্ড প্রসেসিং সফ্টওয়্যার। যে সফ্টওয়্যারটি ব্যবহার করে আমরা স্ক্রিণে টাইপ করি সেটা। দ্বিতীয়ত, কী-বোর্ড লে-আউট অর্থাৎ কী-বোর্ডের কোন্ কী (key) প্রেস করলে কোন্দ ক্যারেক্টার টেক্সট এডিটর সফ্টওয়্যারের স্ক্রীনে দেখা যাবে তা। তৃতীয়ত, ল্যাঙ্গুয়েজ ইন্টারফেইস সফ্টওয়্যার এবং চতুর্থ, ফন্ট/অক্ষর হলো কী-বোর্ডের কোন কী (key) প্রেস করলে তার বিপরীতে যে ক্যারেক্টার এডিটর স্ক্রীন এ দেখা যায় তা।

বাংলা ইউনিকোডের জন্য বিজয় ও অভ্র
কম্পিউটারে বহুল ব্যবহৃত অপারেটিং সিস্টেম গুলোতে ডিফল্ট ল্যাঙ্গুয়েজ হিসেবে ইউএস-ইন্টারন্যাশনাল ল্যাঙ্গুয়েজ ও তার উপযোগী ল্যাঙ্গুয়েজ ইন্টারফেইস সফ্টওয়্যার ও ফন্ট সেটআপ করা থাকে। আর সমগ্র বিশ্বেই ইংরেজি ভাষায় টাইপকরার ক্ষেত্রে ইউএস-ইন্টারন্যাশনাল কী-বোর্ড লে-আউট ব্যবহার করা হয়। ফলে স্থান, কাল, পাত্রভেদে অনায়েসে ইংরেজিতে টাইপ করা ও ইংরেজিতে লিখা যেকোন ডকুমেন্ট পড়া যাচ্ছে। কিন্তু ইংরেজি ছাড়া অন্য কোন ভাষার ক্ষেত্রেই যত বিপত্তি। এখন কথা হচ্ছে, আপনার কম্পিউটার যদি বাংলা লিখা ও পড়ার জন্য উপযোগী হয়ে থাকে তবে আপনি অনায়াসে মার্তৃভাষা বাংলায় কাজ করতে পারবেন। কিন্তু আপনার কম্পিউটারে বাংলায় টাইপ করা কোন ডকুমেন্ট যদি অন্য কোন কম্পিউটারে (পেনড্রাইভ, ল্যান, ই-মেইলে কিংবা অন্য কোন মাধ্যম ব্যবহার করে ট্রান্সফার করে) পড়তে, দেখতে, কোন পরিবর্তন বা পরিবর্ধন করতে চান তবে তা সম্ভব নাও হতে পারে। কারণ সেটা বিকৃত হয়ে যাবার ভয় থেকেই যায়। আর এই বিপত্তি দুর করতেই যে ভাষায় টাইপ করতে চাই তার উপযোগী ল্যাঙ্গুয়েজ ইন্টারফেইস সফ্টওয়্যার ও ইউনিকোডভিত্তিক ফন্ট প্রয়োজন। বাংলা টাইপিং জন্য বর্তমানে জনপ্রিয় ল্যাঙ্গুয়েজ ইন্টারফেইস সফ্টওয়্যার হলো বিজয় ও অভ্র। বিজয় বাণিজ্যিক হলেও অভ্র সকলের জন্য উন্মুক্ত।

ইউনিকোডে বাংলাদেশের সদস্যপদ
মাত্র ১২ হাজার ডলারের জন্য বছরের পর বছর অপেক্ষা করেছি আমরা। বাংলাদেশ রাষ্ট্র তার একমাত্র রাষ্ট্রভাষা বাংলার জন্য এই পরিমাণ টাকা ব্যয় করতে পারেনি। শেষ পর্যন্ত স্থপতি ইয়াফেস ওসমানের মন্ত্রিত্বের সময়ে সে স্বপ্নের সিঁড়ি আমরা পার হলাম। প্রায় ২৩ বছর পর বাংলাদেশ সরকার ইউনিকোড কনসোর্টিয়ামের সদস্য হলো। অন্তত আরো ১৮ বছর আগে এই সদস্যপদ পাওয়া অতি প্রয়োজন ছিল। গত ৩০ জুন ২০১০ ইউনিকোড কনসোর্টিয়াম বাংলাদেশ সরকারকে সদস্যপদ দান করে এবং ১ জুলাই ২০১০ থেকে এ সদস্যপদ কার্যকর হয়। প্রাথমিকভাবে এক বছরের জন্য বাংলাদেশ ১২ হাজার ডলার সদস্য চাঁদা দিয়েছে এবং প্রতি বছর বার্ষিক চাদা পরিশোধ করে এই সদস্যপদ নবায়ন করতে হবে। ১৮ মার্চ ২০১০ ইউনিকোড সদস্যপদের জন্য আবেদন করে ৩০ জুনের মাঝে সদস্যপদ পাওয়া নিঃসন্দেহে একটি বড় ধরনের মাইলফলক অর্জন।

ভারতের পে আঞ্চলিক ভাষা হিসেবে সর্বপ্রথম বাংলা ইউনিকোড
ভারতের পে আঞ্চলিক ভাষা হিসেবে সর্বপ্রথম বাংলা ভাষালিপি ইউনিকোডে নিবন্ধিত হয়। কিন্তু বাংলা ভাষাকে ইউনিকোড মানভুক্ত করা একটি বিরাট চ্যালেঞ্জ ছিল। বাংলা ভাষায় দাঁড়ি ও ডাবল দাঁড়ি ইউনিকোড মানে হিন্দি থেকে নিতে হয় তবুও বাংলাদেশ বিডিএস ১৫২০: ২০১১ নামক কোডসেট প্রমিত করে এটি নিশ্চিত করেছিল যে, সব বর্ণকে ইউনিকোডভুক্ত করাটা কেবলমাত্র কনসোর্টিয়ামের একটি সিদ্ধান্তের বিষয়। ইউনিকোড কনসোর্টিয়াম তাদের ৬.০ সংস্করণেও এই দুটি বর্ণকে আলাদা করে কোডভুক্ত না করে হিন্দি থেকে ব্যবহারের জন্য পরামর্শ দিয়েছিল। ২০১১ সালে ইউনিকোড ৫.২ সংস্করণে বাংলাদেশের ইউনিকোড মানের জন্য আবেদন করা হয়। এরপর ইউনিকোড ৫.২ সংস্করণ থেকে শুরু হওয়া ওয়েবে বাংলা বর্ণের স্বীকৃতিতে দাড়ি আর ডবল দাড়ি নিয়ে হিন্দি অক্ষর ব্যবহার করতে বাংলাদেশকে পরামর্শ দেয় ইউনিকোড কনসোর্টিয়াম। এর আগে ওয়েবে বাংলা অক্ষর 'ড়', 'ঢ়', 'য়' এবং 'ৎ' নিয়েও জটিলতা তৈরি হয়। বেসরকারি উদ্যোগে ইউনিকোড ৪.৫ সংস্করণে এই অক্ষরগুলোর বাংলাদেশের মানকে স্বীকৃতি দেওয়া হয়।

কমপিউটারে বাংলা ভাষা
অ্যাপলের গ্রাফিক্যাল ইউজার ইন্টারফেস এবং কুইক ড্র অ্যাপ্লিকেশনগুলো খুব সহজে গ্রাফিক্স পদ্ধতিতে রোমান ছাড়া অন্য ভাষার বর্ণমালা উৎপন্ন করতে শুরু করে। মাল্টিপল ফন্ট ব্যবহারের প্রযুক্তিও এজন্য সহায়তা করেছে। ফলে ডস অপারেটিং সিস্টেমে বাংলা প্রয়োগ করার চেষ্টা আশির দশকের শুরুতে করা হলেও বস্ত্তত অ্যাপল মেকিন্টোস কমপিউটারেই প্রথম বাংলা ভাষা সঠিক ও সুন্দরভাবে লেখা হয়। ১৯৮৭ সালের ১৬ মে প্রকাশিত হয় কমপিউটারে কম্পোজ করা প্রথম বাংলা পত্রিকা-আনন্দপত্র। পরে ১৯৯৩ সালে উইন্ডোজ-এর হাত ধরে মেকিন্টোসের সেই প্রযুক্তি পিসিতে আসে।

ইউনিকোড ছাড়া বাংলা লেখায় তিনটি সমস্যা
এক. ২৫৬ কোডের আসকি কোড সেট নিয়ে বাংলা লেখার প্রধান অসুবিধা তিনটি। প্রথমত বাংলা বর্ণের সংখ্যা অনেক বেশি। ২৫৬ কোডের মাঝে সর্বোচ্চ ২২০টি কোড ব্যবহার করে বাংলা সব যুক্তাক্ষর অবিকৃতভাবে লেখা অসম্ভব। এতে বর্ণসমূহের সৌন্দর্য রক্ষা করা কঠিন হয়ে পড়ে। বেশিরভাগ বর্ণকে সঠিকভাবে উৎপন্ন করা গেলেও অনেক বর্ণ তার প্রকৃতরূপে দেখা যায় না। ফলে যখনই বাংলা হরফের বিষয়টি পর্যালোচনা করা হয়, তখনই দেখা যায় যুক্তাক্ষরগুলো তার আদি রূপ হারিয়ে ফেলছে বা নানা ধরনের অক্ষরাংশ দিয়ে তৈরি হচ্ছে বলে যথাযথভাবে সেটি উৎপন্ন হচ্ছে না। বাংলা হরফে যেহেতু শুধু বর্ণ নয় চিহ্নও আছে, সেহেতু সেগুলো সঠিকভাবে বর্ণসমূহের সাথে যুক্ত হচ্ছে কি না তাও দেখার বিষয়। বাস্তবতা হলো ২৫৬টি কোডে বাংলা সঠিকভাবে লেখা সম্ভব নয়।

দুই. আসকি কোডের দ্বিতীয় অসুবিধা হলো, বাংলা ভাষার জন্য এর কোনো মান নেই। বাংলাদেশের বিএসটিআই এক সময়ে বাংলার জন্য একটি মান তৈরির চেষ্টা করে ব্যর্থ হয়। যদিও ২০০০ সালে একটি মান তৈরি হয় তবুও সেটি আসকিভিত্তিক ছিলোনা। অন্যদিকে বেসরকারি সফটওয়্যার নির্মাতারা নিজেরা একেকটি মান তৈরি করে বলে একাধিক মানের জন্ম হয়েছে। এজন্য বাংলাদেশের একাধিক মান, পশ্চিমবঙ্গের একাধিক মান এবং আসাম, ত্রিপুরার মানগুলো নিয়ে আমরা ব্যাপকভাবে সঙ্কটে পড়েছি। যদিও বাংলাদেশে ‘বিজয়’-এর মান অনেকটাই প্রচলিত, তবুও অন্য মানগুলোর কথা একেবারে অস্বীকার করা যাবে না।

তিন. খুব বেশি গুরুত্বপূর্ণ না হলেও তৃতীয় আরেকটি সমস্যা হলো; একই কোড ইংরেজি ও বাংলা ব্যবহার করে বলে ফন্ট পরিবর্তনের সাথে সাথে ভাষাও বদলে যেতে পারে। বাংলা-ইংরেজি মিশ্রিত দলিলে এটি বেশ বড় ধরনের সমস্যা তৈরি করে। ইউনিকোড মান আমাদের এসব সমস্যার সমাধান দিয়েছে। যদিও ইউনিকোড মানে শুধু মূল বর্ণগুলোর মান রয়েছে এবং আমাদের যুক্তবর্ণকে কোনো মান দেয়া হয়নি, তথাপি ওপেনটাইপ নামের একটি প্রযুক্তি দিয়ে আমরা অক্ষরের সংখ্যা যেকোনো পর্যায়ে নিয়ে যেতে পারি। ফলে অক্ষরের আকার-আকৃতি নিয়ে যে সমস্যা আসকিতে রয়েছে, সেটি আর থাকে না। ইউনিকোড যেহেতু সবার কাছে গ্রহণযোগ্য সেহেতু এর মান নিয়ে কোনো প্রশ্ন উঠছে না। বাংলাদেশে ইউনিকোড মান সরকারি স্বীকৃতি পেয়েছে। এমনকি পশ্চিমবঙ্গেও এটি স্বীকৃতি পেয়েছে।

ইউনিকোডে অন্তর্ভুক্ত লিপিসমূহ
বিশাল লিপিসংকেতের সমর্থন থাকায় ক্লায়েন্ট সার্ভার বা বহুমুখী এ্যপ্লিকেশন এবং ওয়েবের গঠনে পুরোনো লিপিমালার ব্যবহার না করে ইউনিকোডের ব্যবহার অনেক খরচ কমিয়ে আনতে পারে। ইউনিকোড কোনো বাড়তি প্রকৌশল ছাড়াই একটি সফটওয়্যার বা ওয়েবসাইটকে বিভিন্ন প্লাটফর্ম, ভাষা এবং দেশে ব্যবহারযোগ্যতা দেয়। এটা ব্যবহারের ফলে ডাটা বিভিন্ন সিস্টেমের মধ্যে দিয়ে আনাগোনা করতে পারে কোনো রকম বিকৃতি ছাড়াই। এখন পর্যন্ত যেসব লিপিসমূহ ইউনিকোডে অন্তর্ভুক্ত হয়েছে সেগুলো হচ্ছে, আরবি, আর্মেনীয়, বাংলা, ব্রাই বা ব্রেইল, কানাডীয় আদিবাসী, চেরোকী, কপ্টীয়, সিরিলীয়, দেবনাগরী, ইথিওপীয়, জর্জীয়, গ্রিক, গুজরাটি, গুরুমুখী (পাঞ্জাবি), হান (কাঞ্জি, হাঞ্জা, হাঞ্জি), হাঙ্গুল (কোরীয়), হিব্রু, হিরাগানা ও কাতাকানা (জাপানি), আ-ধ্ব-ব
খমের (ক্যাম্বোডীয়), কন্নড়, লাও, লাতিন, মালয়ালম, মঙ্গোলীয়, বর্মী, ওড়িয়া, সিরীয়, তামিল, তেলুগু, থাই, তিব্বতি, টিফিনাঘ, য়ি, ঝুয়িন।

আশরাফ আহমদ
বাংলাদেশ কম্পিউটার কাউন্সিলের নির্বাহী পরিচালক
অবশেষে ৩ বছর আন্দোলনের পর গত ১৫ জুলাই যুক্তরাষ্ট্র ভিত্তিক আন্তর্জাতিক প্রতিষ্ঠান ইউনিকোড কনসোর্টিয়াম (বাংলাদেশের মান বিডিএস ১৫২০:২০১১) বাংলা ইউনিকোডকে স্বীকৃতি দিয়েছে। চলতি বছরের মে মাসে ইউনিকোড কনসোর্টিয়ামের মিটিংয়ে বিসিসির প্রতিনিধি এনামুল কবির এ বিষয়ে প্রস্তাব উপস্থাপন করেন। কিন্তু প্রথম দিকে এ বিষয়ে আপত্তি তোলায় জুলাইয়ে প্রকাশিতব্য ইউনিকোড ৭.০- অন্তর্ভুক্ত হচ্ছে না। তবে ইউনিকোড কনসোর্টিয়াম কর্তৃপক্ষ জানিয়েছে, ইউনিকোড ৮.০ সংস্করণে বাংলাদেশের মানকে অন্তর্ভুক্ত করা হবে। আর এর মাধ্যমে ২০১১ সাল থেকে শুরু হওয়া ওয়েবে বাংলা বর্ণের আত্মস্বীকৃতিতে দাঁড়ি আর ডবল দাঁড়ি নিয়ে হিন্দি অক্ষরের সঙ্গে যে বিরোধ ছিল তা থেকে মুক্তি পেল বাংলা ভাষা।

মোস্তাফা জব্বার
তথ্য-প্রযুক্তিবিদ
এখন থেকে ইউনিকোড এনকোডিংয়ের আমাদের বিশ্বমান দাড়ালো। যেটার উপর ভিত্তি করে আমরা তথ্য আদান প্রদানের বিষয়টি প্রমিতকরণ করতে পারছি। এটা আমাদের জন্য বিশাল বিজয়ের খবর। ১৯৮৯ সাল থেকেই আমার ইউনিকোডে বাংলাভাষায় বাংলাদেশের মান প্রতিষ্ঠায় আন্দোলন করে আসছি। আমরা যখন ২০১১ সালে ইউনিকোড ৫.২ সংস্করণে বাংলাদেশের ইউনিকোড মান চেয়েছিলাম, তখন দাঁড়ি এবং ডবল দাঁড়ির জন্য হিন্দি কোড আমাদের জন্য বরাদ্দ করা হয়েছিল। আমরা বরাবরই কর্তৃপক্ষের কাছে যুক্তি দিয়ে উপস্থাপন করেছি দেখতে একরকম হলেও বাংলা অক্ষরের ব্যবহারিক স্বাতন্ত্র্য রয়েছে। তাই বাংলা ভাষার কোড হিন্দি থেকে আমরা কখনোই নেব না। আমলাতান্ত্রিক জটিলতা কাটিয়ে যুক্তিসঙ্গতভাবে আমরা আমাদের যুক্তি উপস্থাপনের মাধ্যমে বিজয় পেলাম। এই স্বীকৃতির ফলে হিন্দী কোডপ্রেস থেকে আমাদের কিছু নিতে হবে না। ইউনিকোড আমাদের দাড়ি এবং দুই দাড়ি বাংলার কোড হিসেবে গ্রহণ করেছে। বাংলায় দাড়ি ও ডাবল দাড়ি ব্যবহার করার মানে ছিল দেবনাগরী কোড ব্যবহার করা। অথচ ব্রাহ্মীলিপি থেকে উৎপত্তি হওয়া অন্য অনেক ভাষায় আলাদাভাবে দাড়ি ও ডাবল দাড়ি অন্তর্ভুক্ত আছে। এসব কারনে ইউনিকোড দিয়ে সঠিকভাবে বাংলা লেখা যেতো না। এখন আর সেসব সমস্যা রইল না। ইউনিকোড ৭.০-এর সব চূড়ান্ত হয়ে যাওয়ায় আমরা ইউনিকোড ৮.০ সংস্করণে এ স্বীকৃতি পাচ্ছি। ইউনিকোড কনসোর্টিয়াম প্রতিষ্ঠার প্রায় ২৩ বছর পর বাংলাদেশ সরকার ইউনিকোড কনসোর্টিয়ামের সদস্য হয়েছিল ২০১০ সালের ৩০ জুন। আমরা যদি শুরতেই সদস্য হতাম তাহলে আমাদের অর্জনের পাল্লা ভারী হতো। প্রাথমিকভাবে এক বছরের জন্য বাংলাদেশ ১২ হাজার ডলার সদস্য চাঁদা দিয়েছে এবং প্রতি বছর বার্ষিক চাদা পরিশোধ করে এই সদস্যপদ নবায়ন করতে হয়।

তথ্য সূত্র:
দৈনিক যুগান্তর, প্রিয়.কম, মাসিক কম্পিউটার জগৎ, উইকিপিডিয়া, ইউনিকোড.অর্গ।

বাংলা ইউনিকোডের আন্তর্জাতিক স্বীকৃতির ইতিবৃত্ত

১০,০৫৭ ভিআইপি টিকিটের চাহিদা থাকায় বেঙ্গালুরু থেকে সরেছে ফাইনালের ভেন্যু

সিরিয়া: স্বৈরাচারী শাসন পতনের পর কী আচরণ করা উচিত

রাতের আকাশে রহস্যময় আলো

কদমতলীতে ফোম কারখানায় ভয়াবহ আগুন

বাংলাদেশ-পাকিস্তানের মধ্যে মাদক পাচার রোধে সমঝোতা স্মারক সই

দিনে ৫০০০ কোটি টাকা লোকসান, তবু বিজ্ঞাপন দেখায় না গুগল

স্মার্টওয়াচ জানাবে আপনি কখন অজ্ঞান হতে পারেন: গবেষণা