Tamil Unicode
-
தமிழ் ஒருங்குறி ?! – 17
ஒரு சட்டம், வரையறை, கோட்பாடு இயற்றுவதில் வெள்ளைக்காரன் கெட்டிக்காரன் தான். ஏனெனில், அவன் மற்ற இனத்தவர்களை விட இவைகளை இயற்ற முதலில் எத்தணித்தவன். ஆகவே, அவனுக்கு பல முறை முட்டி மோதி, பல முறை மேம்படுத்தி பழக்கப்பட்டவன். இன்றும், கையில் அதிகாரம் இருந்தால் கூட களவு செய்ய முடியாதபடி (அ) செய்தாலும் பிடிபடும்படி நுணுக்கமாக ஒரு கட்டமைப்பை உருவாக்கி இருப்பதால் தான், கடையின் சொந்தக் காரன் வீட்டில் இருக்க வேலைக்காரன் கல்லாவில் அமர்ந்தாலும் கடை நஷ்டத்தில் போவதில்லை. ஆகவே, ஒருங்குறி அமைப்பின் சட்ட திட்டங்கள் சரியானதாகவே இருக்கலாம். ஒருங்குறி ஒரு உலக மொழி ஒருங்கமைப்பு என்ற ரீதியில் நோக்குவோமானால் அவர்களின் சட்ட திட்டங்கள் மிகச் சரியானவையே. அதையே, தமிழை மட்டும் பார்த்தால், தமிழுக்கு விவேகக் குறைவே. இருந்தாலும் தமிழை மட்டும் அவர்களால் பார்க்க இயலாது. ஆகவே அவர்கள் நிலைப்பாடு சரியானதே. இதில் இருந்து என்ன கற்றுக்கொள்ள வேண்டிய விடயம்? இனிமேலாவது தமிழ் மொழியை யாரும் பார்த்துக்கொள்வார்கள் என்று விடாமல், நாம் தாம் நம் மொழியின் முன்னேற்றத்திற்கு…
-
இடுகைகளில் தமிழில் தலைப்பு வைக்கும்போது கவனிக்கப்பட வேண்டியவை
வலைப்பதிவில் இடுகைகள் இடும்போது, தமிழில் தலைப்பை வைப்பதினால் சில தொழில்நுட்ப சிக்கல்களுக்குள் தள்ளப்படுகிறார்கள், நமது தமிழ் வலைப்பதிவாளர்கள். அவற்றை சரி செய்ய வழியை இங்கே தருகிறேன். ஒருங்குறித் தமிழ் கணினியில் வேலை செய்தாலும், எல்லா இடங்களிலும் ஒருங்குறித் தமிழ் வேலை செய்யாது. இதற்குக் காரணம் தமிழ் இரண்டாம் தர மொழியாக ஒருங்குறியில் ஏற்றப்பட்டதே. [மேலும் அறிய தமிழ் ஒருங்குறி?!] உங்கள் இடுகைகளை தமிழ் தலைப்பில் சேமிக்கும்போது வலைப்பதிவு மென்பொருள் அந்த தலைப்பை இணைய முகவரியாக எடுத்துக்கொள்கிறது. ஆனால், “போ” என்பது இணைய முகவரி இடும் இடத்தில் அப்படி சரியாகத் தெரியாது. அது இணைய முகவரிகளை சேமிக்கும் முறையில் மாற்றியே தெரியும். அது மட்டுமல்லாமல் “போ” என்பது தமிழ் ஒருங்குறியில் 2 குறிகள். ஒரு குறி அல்ல. அப்படித் தான் தமிழ் ஒருங்குறி அமைக்கப்பட்டு இருக்கிறது. இப்போது நீங்கள் உங்கள் இடுகைக்கு “நான்” என்று தலைப்பைக் கொடுத்தால் அது உண்மையில் 4 குறிகள். இணைய முகவரிக்கு 255 எழுத்துக்களை தாண்டக் கூடாது என்பது விதியாகும். இப்போது நீங்கள்…
-
தமிழ் ஒருங்குறி ?! – 16
– ஒருங்குறியின் மேன்மை – பிற மொழிகள் இடம்பெற்ற முறை – தமிழ் மொழிக்கு உள்ள இடம் – தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல் – தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு – தமிழுக்குக் கிடைக்க வேண்டிய இடம் – தமிழை உயர்த்த செய்ய வேண்டிய பணிகள் – போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன். ஒருங்குறியும் தமிழும் மேலே உள்ள சுட்டியை தட்டி பவர் பொய்ன்றை தரையிறக்கிக் கொள்ளவும். ______ CAPital பி.கு. :- பவர் பொய்ன்றில் தமிழ் சரியாகத் தெரியாதவர்கள் TSCu_Paranar.ttf எழுத்துருவை தரை இறக்கி நிறுவிப் பார்க்கவும். ஒருங்குறிக்கே இந்த நிலமையா! 🙁 TSCu_Paranar தரையிறக்கியவுடன் TSCu_Paranar.txt என்னும் கோப்பின் பெயரை TSCu_Paranar.ttf என்று மாற்றுக. பாகம் – 17 >> << பாகம் – 15
-
தமிழ் ஒருங்குறி ?! -15
இது தான் ஒருங்குறியில் உள்ள உலக மொழிகளின் அட்டவணை: http://www.unicode.org/charts/ நன்றாகக் கவனிக்கவும்: Armenian Armenian Ligatures Coptic Coptic in Greek block Cyrillic Cyrillic Supplement Georgian Georgian Supplement Greek Greek Extended Ancient Greek Numbers Ancient Greek Musical Basic Latin Latin-1 Latin Extended A Latin Extended B Latin Extended C (5.0) Latin Extended D (5.0) Latin Extended Additional Latin Ligatures Fullwidth Latin Letters Small Forms இவ்வாறு பல தரப்பட்டுள்ளது. நமது தமிழுக்கும் இதைப் போல் ஒரு “Tamil Supplement” என்று தற்போது தமிழ் ஒருங்குறியில் இல்லாத எழுத்துக்களை ஏற்ற முயற்சிக்கலாம். ஒருங்குறி அட்டவணையைப் பாருங்கள். ஏறக்குறைய அதில் உள்ள எல்லா மொழிகளுக்கும் “Supplement”, “Extended” என்ற எதோ ஒரு முறையில் தமது எல்லா எழுத்துக்களையும் ஏற்றியிருக்கிறார்கள் அம் மொழி வல்லுனர்கள். ஏன் Latin எழுத்துக்களுக்கே எத்தனையோ “Extended” எழுத்துக்களை ஏற்றியிருக்கிறார்கள். எத்தியோப்பியா “Supplement” என்றும் “Extended”…
-
தமிழ் ஒருங்குறி ?! -14
நான் சொன்ன தமிழ் எழுத்துக்கள் யாவற்றையும் கணினியில் ஏற்றுதல் என்பது, விசைப்பலகையில் [keyboard] ஏற்றுதல் என்பதல்ல. பேச்சுக்குச் சொன்னால் கணினியின் மூளையில் ஏற்றுவது. அதாவது ஒருங்குறி என்பது விசைப்பலகை அல்ல. அது ஒரு தகுதரம் [Standard for Computer Information Interchange]். அந்த தகுதரத்தில் தமிழை சரியாக ஏற்றியிருக்கலாம். இப்ப எத்தனை கீகள் விசைப்பலகையில் இருக்கிறதோ, அத்தனையே வைத்திருக்கலாம். வேணுமென்றால், கூட்டி (அ) குறைத்துக் கூட வைத்திருக்கலாம். அதாவது ஃபிரஞ்சு, ஜேர்மன், ஸ்பானிய மொழிகளில் உள்ளது போல் தமிழிலும் எல்லா எழுத்துக்களையும் ஏற்றியிருக்கலாம். à, á, â, ã, å̀́ இவை இங்கே காண்பது போல் ஒரு எழுத்தாகவும், பிரித்து தனித் தனியாகவும் a, ̀, ́, ˆ, ˜, ˚ ஏற்றப்பட்டிருக்கிறது. இனிமேல் தமிழுக்கு அவ்வளவு இடங்கள் கிடைக்கும் என்று நம்பிக்கை இல்லை தான். அப்படி கிடைத்தாலும் ஏற்கனவே இப்போதிருக்கும் ஒருங்குறியில் ஊறிப்போனவர்கள் மாற்றத்தை விரும்ப மாட்டார்கள். அப்ப பிறகேன் இந்தக் கதறல்? விட்டது பிழை என்று ஒத்துக்கொள்ளலாம்ல… இல்லை. தமிழ் மொழி இப்படித்…
-
தமிழ் ஒருங்குறி ?! -13
நான் இப்போது XP – ல் தமிழை புகுத்தி எழுதுகிறேன். அதில் தமிழ் என்று அடிக்க lcfBd என்று அடிக்க வேண்டும். (தலைசுற்றுகிறதா) இதில் என்ன வசதி இருக்கப்போகிறது. மேலே படியுங்கள்! ஆனால் மலயாளத்தில் அதே தமிழை அடிக்க அதே lcfBd என்று அடித்தால் போதும். lcfBd – തമിഴ് – தமிழ் – இந்த மூன்று சொற்களையும் அடிக்க நான் பயன்படுத்தியது ஒரே கீகள்தான். மொழியைமட்டும் மாற்றினால் போதும். எவ்வளவு வசதி. ஆமாம் நீங்கள் சொல்வது சரி. ஒரே கீகளைப் பயன்படுத்தி மற்றய இந்திய மொழிகளைப் பெறலாம். இந்த ஒரே ஒரு இலகுவான விடயத்திற்காக தமிழ் பலதை இழந்துள்ளது. அதிலும் பல வெற்றிடங்கள் உள்ளன. அதாவது, இந்தி மொழியில் உள்ள ஒரு எழுத்து தமிழ் மொழியில் இல்லையென்றால், நீங்கள் சொல்வது போல் செய்ய முடியாது. இப்படி உள்ள வெற்றிடத்தை நிரப்பும் முயற்சியாகத் தான் பல புதிய எழுத்துக்கள் தமிழில் சேர்க்கப்படுகின்றன. புதிதாக சேர்க்கப்பட்ட இன்னுமொரு “ச” எல்லாம் இதன் காரணமே. [ச, ஷ, ஸ,…
-
தமிழ் ஒருங்குறி ?! -12
தமிழ் ஒருங்குறியில் சரியா பிழையா என்று யோசிக்காவிட்டாலும், தமிழ் எழுத்துக்களின் வரிசையில் அவை இல்லை என்பதை ஒத்துக்கொள்ள வேண்டும். வரிசையில் இருந்திருந்தால், எந்த கணினி மொழியிலும் மேலதிக உதவி இல்லாமல் தமிழை வரிசைப்படுத்தலாம். நீங்கள் அரிச்சுவடி பார்த்திருக்கிறீர்களா? [என்ன நக்கலு? .. கி..கி..கி..]. அதில் எழுத்துக்கள் ஒரு ஒழுங்கில் இருக்கும். நீங்கள் படிப்பதற்கு அது இலகுவாக இருக்கும். சரி அதே எழுத்துக்களை ஒழுங்கு மாறி அரிச்சுவடி தந்தால், உங்களால் படிக்க முடியாமல் போகாது. படிக்க முடியும், ஆனால் சற்றே சிரமமாக இருக்கும். பலர் இந்த ஒழுங்கு மாற்றத்திற்கு கூறும் காரணம், அப்போது தானாம் மற்றய இந்திய மொழிகளுக்குள்ளே மாற்றிக்கொள்ளலாமாம். naam thamingkilish ezhuthuvathaRku aangkila ezhuththukkaLaip paavikkiRoom. ithaRku oru mozhi maRRaya mozhikkaaha ezhuththu idam maaRi irukkaveeNdiya avasiyam illai. [நாம் தமிங்கிலிஷ் எழுதுவதற்கு ஆங்கில எழுத்துக்களைப் பாவிக்கிறோம். இதற்கு ஒரு மொழி மற்றய மொழிக்காக எழுத்து இடம் மாறி இருக்கவேண்டிய அவசியம் இல்லை.] சரி ஆங்கிலம் வேறு தமிழ் வேறு என்று…
-
தமிழ் ஒருங்குறி ?! -11
இக் கோப்புகள் “tamil-ulagam” என்னும் யாகூ குழுமத்தில் இருந்து எடுக்கப்பெற்றவை. Tamil Encoding Newsletter3 Tamil Encoding Newsletter5 Tamil Encoding Newsletter7 பாகம் – 12 >> << பாகம் – 10 _____ CAPital
-
தமிழ் ஒருங்குறி ?! -10
1) ஒருங்குறி என்பது ஒரு இந்திய தகுதரம் அல்ல. உலக தகுதரம். அதனால், அனுஸ்வரா, விசர்க்கம் என்று தமிழ் எழுத்துக்களுக்கு உலக மேடையில் பெயர் வைக்கத் தேவையில்லை. ஐயா உலக மேடையில் “தமிழ்” இன் உச்சரிப்பு “டமில்” [Tamil] என்று தான் இருக்கிறது. உலக மேடையில், ஆய்தத்தின் உச்சரிப்பு விசர்க்கம் என்றே இருக்கும். 2) உலக மேடையில், தமிழ் எழுத்துக்கள் ஒழுங்கு மாறி வைக்கப்பட்டுள்ளது. 3) இந்தப் பிழைகளை, ஒருங்குறி ஒன்றியம் செய்யவில்லை. இந்திய அரசாங்கமே செய்தது. வட மொழிகளில் உள்ள சத்தங்களை தமிழில் கொண்டுவருகிறோம் என்று கொண்டுவந்து தமிழ் எழுத்துக்களைக் கூட்டினார்கள். ஏன் உலகில் உள்ள எல்லா சத்தங்களுக்கும் தமிழில் ஒரு எழுத்து உருவாக்கி இருக்கலாமே? [சிங்களத்தில் உள்ளது போல்] ஆகவே, அப்போதிலிருந்தே வடமொழிக்கு ஏற்பவாறே தமிழ் மாற்றியமைக்கப் பட்டு வருகிறது. இதை வாசியுங்கள்: http://www.indiawebdevelopers.com/technology/oracle9i/sorting.asp ” Conventionally, when character data is stored, the sort sequence is based on thenumeric values of the characters defined by…
-
தமிழ் ஒருங்குறி ?! -9
எத்தனை பேருக்கு உண்மையிலேயே ஒருங்குறி பிழையால் தான் தமிழ் இவ்வளவு பின்னடைவு என்று தெரியும்? உண்மையாக உரைக்கவும். இந்தப் பின்னடைவுக்கு காரணம் உணராமலே பலர் உள்ளர். கூகிள் இவ்வளவு பெரிதாக வருவதற்கு முன்னரே நான் ஒருங்குறி பற்றிக் கேள்விப் பட்டிருக்கிறேன். தமிழ் பிரச்சினை ஒருங்குறியில் தீரும் என்று பெரும் நம்பிக்கை. ஒருங்குறி என்பது வெறும் font மட்டும் அல்ல. அதற்கு மேலே ஒரு கணினியின் அடித்தள தகுதரம். அத்திவரத்திலேயே தமிழில் குளருபடியென்றால், சுவர்கள் எழுப்ப முடியாதென்றில்லை; ஆனால் weak ஆக இருக்கும். இப்படிப் பட்ட ஒருங்குறியிலேயே தமிழ் தெரியவில்லை சில மென்பொருளில். மற்றய மொழிகள் தெரியும் போது ஏன் தமிழ் தெரியவில்லை. நான் நினைத்தேன், தமிழ் உண்மையிலேயே ஒரு கடின மொழி. உயிர், மெய், நெடுங்கணக்கு என்று ஏதோ எதோ இருப்பதால், தமிழ் இவ்வாறு பிரச்சினையாய் இருக்கிறது என்று. எனக்கு மட்டும் அல்ல, எனக்கு தெரிந்த வரையில் ஒருவருக்கும், தமிழின் கணினித் துரோகம் தெரிந்திருக்க வில்லை. உங்களுக்கும் தெரிந்திருந்ததோ தெரியவில்லை. பலர், தமிழை கணினியில் சும்மா…