Tamil Unicode

  • India,  Internet,  Tamil Unicode

    தமிழ் ஒருங்குறி ?! – 17

    ஒரு சட்டம், வரையறை, கோட்பாடு இயற்றுவதில் வெள்ளைக்காரன் கெட்டிக்காரன் தான். ஏனெனில், அவன் மற்ற இனத்தவர்களை விட இவைகளை இயற்ற முதலில் எத்தணித்தவன். ஆகவே, அவனுக்கு பல முறை முட்டி மோதி, பல முறை மேம்படுத்தி பழக்கப்பட்டவன். இன்றும், கையில் அதிகாரம் இருந்தால் கூட களவு செய்ய முடியாதபடி (அ) செய்தாலும் பிடிபடும்படி நுணுக்கமாக ஒரு கட்டமைப்பை உருவாக்கி இருப்பதால் தான், கடையின் சொந்தக் காரன் வீட்டில் இருக்க வேலைக்காரன் கல்லாவில் அமர்ந்தாலும் கடை நஷ்டத்தில் போவதில்லை. ஆகவே, ஒருங்குறி அமைப்பின் சட்ட திட்டங்கள் சரியானதாகவே இருக்கலாம். ஒருங்குறி ஒரு உலக மொழி ஒருங்கமைப்பு என்ற ரீதியில் நோக்குவோமானால் அவர்களின் சட்ட திட்டங்கள் மிகச் சரியானவையே. அதையே, தமிழை மட்டும் பார்த்தால், தமிழுக்கு விவேகக் குறைவே. இருந்தாலும் தமிழை மட்டும் அவர்களால் பார்க்க இயலாது. ஆகவே அவர்கள் நிலைப்பாடு சரியானதே. இதில் இருந்து என்ன கற்றுக்கொள்ள வேண்டிய விடயம்? இனிமேலாவது தமிழ் மொழியை யாரும் பார்த்துக்கொள்வார்கள் என்று விடாமல், நாம் தாம் நம் மொழியின் முன்னேற்றத்திற்கு…

  • Tamil Unicode,  WordPress Tips

    இடுகைகளில் தமிழில் தலைப்பு வைக்கும்போது கவனிக்கப்பட வேண்டியவை

    வலைப்பதிவில் இடுகைகள் இடும்போது, தமிழில் தலைப்பை வைப்பதினால் சில தொழில்நுட்ப சிக்கல்களுக்குள் தள்ளப்படுகிறார்கள், நமது தமிழ் வலைப்பதிவாளர்கள். அவற்றை சரி செய்ய வழியை இங்கே தருகிறேன். ஒருங்குறித் தமிழ் கணினியில் வேலை செய்தாலும், எல்லா இடங்களிலும் ஒருங்குறித் தமிழ் வேலை செய்யாது. இதற்குக் காரணம் தமிழ் இரண்டாம் தர மொழியாக ஒருங்குறியில் ஏற்றப்பட்டதே. [மேலும் அறிய தமிழ் ஒருங்குறி?!] உங்கள் இடுகைகளை தமிழ் தலைப்பில் சேமிக்கும்போது வலைப்பதிவு மென்பொருள் அந்த தலைப்பை இணைய முகவரியாக எடுத்துக்கொள்கிறது. ஆனால், “போ” என்பது இணைய முகவரி இடும் இடத்தில் அப்படி சரியாகத் தெரியாது. அது இணைய முகவரிகளை சேமிக்கும் முறையில் மாற்றியே தெரியும். அது மட்டுமல்லாமல் “போ” என்பது தமிழ் ஒருங்குறியில் 2 குறிகள். ஒரு குறி அல்ல. அப்படித் தான் தமிழ் ஒருங்குறி அமைக்கப்பட்டு இருக்கிறது. இப்போது நீங்கள் உங்கள் இடுகைக்கு “நான்” என்று தலைப்பைக் கொடுத்தால் அது உண்மையில் 4 குறிகள். இணைய முகவரிக்கு 255 எழுத்துக்களை தாண்டக் கூடாது என்பது விதியாகும். இப்போது நீங்கள்…

  • India,  Tamil Nadu,  Tamil Unicode,  Thamizh

    தமிழ் ஒருங்குறி ?! – 16

    – ஒருங்குறியின் மேன்மை – பிற மொழிகள் இடம்பெற்ற முறை – தமிழ் மொழிக்கு உள்ள இடம் – தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல் – தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு – தமிழுக்குக் கிடைக்க வேண்டிய இடம் – தமிழை உயர்த்த செய்ய வேண்டிய பணிகள் – போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன். ஒருங்குறியும் தமிழும் மேலே உள்ள சுட்டியை தட்டி பவர் பொய்ன்றை தரையிறக்கிக் கொள்ளவும். ______ CAPital பி.கு. :- பவர் பொய்ன்றில் தமிழ் சரியாகத் தெரியாதவர்கள் TSCu_Paranar.ttf எழுத்துருவை தரை இறக்கி நிறுவிப் பார்க்கவும். ஒருங்குறிக்கே இந்த நிலமையா! 🙁 TSCu_Paranar தரையிறக்கியவுடன் TSCu_Paranar.txt என்னும் கோப்பின் பெயரை TSCu_Paranar.ttf என்று மாற்றுக. பாகம் – 17 >> << பாகம் – 15

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -15

    இது தான் ஒருங்குறியில் உள்ள உலக மொழிகளின் அட்டவணை: http://www.unicode.org/charts/ நன்றாகக் கவனிக்கவும்: Armenian Armenian Ligatures Coptic Coptic in Greek block Cyrillic Cyrillic Supplement Georgian Georgian Supplement Greek Greek Extended Ancient Greek Numbers Ancient Greek Musical Basic Latin Latin-1 Latin Extended A Latin Extended B Latin Extended C (5.0) Latin Extended D (5.0) Latin Extended Additional Latin Ligatures Fullwidth Latin Letters Small Forms இவ்வாறு பல தரப்பட்டுள்ளது. நமது தமிழுக்கும் இதைப் போல் ஒரு “Tamil Supplement” என்று தற்போது தமிழ் ஒருங்குறியில் இல்லாத எழுத்துக்களை ஏற்ற முயற்சிக்கலாம். ஒருங்குறி அட்டவணையைப் பாருங்கள். ஏறக்குறைய அதில் உள்ள எல்லா மொழிகளுக்கும் “Supplement”, “Extended” என்ற எதோ ஒரு முறையில் தமது எல்லா எழுத்துக்களையும் ஏற்றியிருக்கிறார்கள் அம் மொழி வல்லுனர்கள். ஏன் Latin எழுத்துக்களுக்கே எத்தனையோ “Extended” எழுத்துக்களை ஏற்றியிருக்கிறார்கள். எத்தியோப்பியா “Supplement” என்றும் “Extended”…

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -14

    நான் சொன்ன தமிழ் எழுத்துக்கள் யாவற்றையும் கணினியில் ஏற்றுதல் என்பது, விசைப்பலகையில் [keyboard] ஏற்றுதல் என்பதல்ல. பேச்சுக்குச் சொன்னால் கணினியின் மூளையில் ஏற்றுவது. அதாவது ஒருங்குறி என்பது விசைப்பலகை அல்ல. அது ஒரு தகுதரம் [Standard for Computer Information Interchange]். அந்த தகுதரத்தில் தமிழை சரியாக ஏற்றியிருக்கலாம். இப்ப எத்தனை கீகள் விசைப்பலகையில் இருக்கிறதோ, அத்தனையே வைத்திருக்கலாம். வேணுமென்றால், கூட்டி (அ) குறைத்துக் கூட வைத்திருக்கலாம். அதாவது ஃபிரஞ்சு, ஜேர்மன், ஸ்பானிய மொழிகளில் உள்ளது போல் தமிழிலும் எல்லா எழுத்துக்களையும் ஏற்றியிருக்கலாம். à, á, â, ã, å̀́ இவை இங்கே காண்பது போல் ஒரு எழுத்தாகவும், பிரித்து தனித் தனியாகவும் a, ̀, ́, ˆ, ˜, ˚ ஏற்றப்பட்டிருக்கிறது. இனிமேல் தமிழுக்கு அவ்வளவு இடங்கள் கிடைக்கும் என்று நம்பிக்கை இல்லை தான். அப்படி கிடைத்தாலும் ஏற்கனவே இப்போதிருக்கும் ஒருங்குறியில் ஊறிப்போனவர்கள் மாற்றத்தை விரும்ப மாட்டார்கள். அப்ப பிறகேன் இந்தக் கதறல்? விட்டது பிழை என்று ஒத்துக்கொள்ளலாம்ல… இல்லை. தமிழ் மொழி இப்படித்…

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -13

    நான் இப்போது XP – ல் தமிழை புகுத்தி எழுதுகிறேன். அதில் தமிழ் என்று அடிக்க lcfBd என்று அடிக்க வேண்டும். (தலைசுற்றுகிறதா) இதில் என்ன வசதி இருக்கப்போகிறது. மேலே படியுங்கள்! ஆனால் மலயாளத்தில் அதே தமிழை அடிக்க அதே lcfBd என்று அடித்தால் போதும். lcfBd – തമിഴ് – தமிழ் – இந்த மூன்று சொற்களையும் அடிக்க நான் பயன்படுத்தியது ஒரே கீகள்தான். மொழியைமட்டும் மாற்றினால் போதும். எவ்வளவு வசதி. ஆமாம் நீங்கள் சொல்வது சரி. ஒரே கீகளைப் பயன்படுத்தி மற்றய இந்திய மொழிகளைப் பெறலாம். இந்த ஒரே ஒரு இலகுவான விடயத்திற்காக தமிழ் பலதை இழந்துள்ளது. அதிலும் பல வெற்றிடங்கள் உள்ளன. அதாவது, இந்தி மொழியில் உள்ள ஒரு எழுத்து தமிழ் மொழியில் இல்லையென்றால், நீங்கள் சொல்வது போல் செய்ய முடியாது. இப்படி உள்ள வெற்றிடத்தை நிரப்பும் முயற்சியாகத் தான் பல புதிய எழுத்துக்கள் தமிழில் சேர்க்கப்படுகின்றன. புதிதாக சேர்க்கப்பட்ட இன்னுமொரு “ச” எல்லாம் இதன் காரணமே. [ச, ஷ, ஸ,…

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -12

    தமிழ் ஒருங்குறியில் சரியா பிழையா என்று யோசிக்காவிட்டாலும், தமிழ் எழுத்துக்களின் வரிசையில் அவை இல்லை என்பதை ஒத்துக்கொள்ள வேண்டும். வரிசையில் இருந்திருந்தால், எந்த கணினி மொழியிலும் மேலதிக உதவி இல்லாமல் தமிழை வரிசைப்படுத்தலாம். நீங்கள் அரிச்சுவடி பார்த்திருக்கிறீர்களா? [என்ன நக்கலு? .. கி..கி..கி..]. அதில் எழுத்துக்கள் ஒரு ஒழுங்கில் இருக்கும். நீங்கள் படிப்பதற்கு அது இலகுவாக இருக்கும். சரி அதே எழுத்துக்களை ஒழுங்கு மாறி அரிச்சுவடி தந்தால், உங்களால் படிக்க முடியாமல் போகாது. படிக்க முடியும், ஆனால் சற்றே சிரமமாக இருக்கும். பலர் இந்த ஒழுங்கு மாற்றத்திற்கு கூறும் காரணம், அப்போது தானாம் மற்றய இந்திய மொழிகளுக்குள்ளே மாற்றிக்கொள்ளலாமாம். naam thamingkilish ezhuthuvathaRku aangkila ezhuththukkaLaip paavikkiRoom. ithaRku oru mozhi maRRaya mozhikkaaha ezhuththu idam maaRi irukkaveeNdiya avasiyam illai. [நாம் தமிங்கிலிஷ் எழுதுவதற்கு ஆங்கில எழுத்துக்களைப் பாவிக்கிறோம். இதற்கு ஒரு மொழி மற்றய மொழிக்காக எழுத்து இடம் மாறி இருக்கவேண்டிய அவசியம் இல்லை.] சரி ஆங்கிலம் வேறு தமிழ் வேறு என்று…

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -11

    இக் கோப்புகள் “tamil-ulagam” என்னும் யாகூ குழுமத்தில் இருந்து எடுக்கப்பெற்றவை. Tamil Encoding Newsletter3 Tamil Encoding Newsletter5 Tamil Encoding Newsletter7   பாகம் – 12 >> << பாகம் – 10 _____ CAPital

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -10

    1) ஒருங்குறி என்பது ஒரு இந்திய தகுதரம் அல்ல. உலக தகுதரம். அதனால், அனுஸ்வரா, விசர்க்கம் என்று தமிழ் எழுத்துக்களுக்கு உலக மேடையில் பெயர் வைக்கத் தேவையில்லை. ஐயா உலக மேடையில் “தமிழ்” இன் உச்சரிப்பு “டமில்” [Tamil] என்று தான் இருக்கிறது. உலக மேடையில், ஆய்தத்தின் உச்சரிப்பு விசர்க்கம் என்றே இருக்கும். 2) உலக மேடையில், தமிழ் எழுத்துக்கள் ஒழுங்கு மாறி வைக்கப்பட்டுள்ளது. 3) இந்தப் பிழைகளை, ஒருங்குறி ஒன்றியம் செய்யவில்லை. இந்திய அரசாங்கமே செய்தது. வட மொழிகளில் உள்ள சத்தங்களை தமிழில் கொண்டுவருகிறோம் என்று கொண்டுவந்து தமிழ் எழுத்துக்களைக் கூட்டினார்கள். ஏன் உலகில் உள்ள எல்லா சத்தங்களுக்கும் தமிழில் ஒரு எழுத்து உருவாக்கி இருக்கலாமே? [சிங்களத்தில் உள்ளது போல்] ஆகவே, அப்போதிலிருந்தே வடமொழிக்கு ஏற்பவாறே தமிழ் மாற்றியமைக்கப் பட்டு வருகிறது. இதை வாசியுங்கள்: http://www.indiawebdevelopers.com/technology/oracle9i/sorting.asp ” Conventionally, when character data is stored, the sort sequence is based on thenumeric values of the characters defined by…

  • Tamil Unicode

    தமிழ் ஒருங்குறி ?! -9

    எத்தனை பேருக்கு உண்மையிலேயே ஒருங்குறி பிழையால் தான் தமிழ் இவ்வளவு பின்னடைவு என்று தெரியும்? உண்மையாக உரைக்கவும். இந்தப் பின்னடைவுக்கு காரணம் உணராமலே பலர் உள்ளர். கூகிள் இவ்வளவு பெரிதாக வருவதற்கு முன்னரே நான் ஒருங்குறி பற்றிக் கேள்விப் பட்டிருக்கிறேன். தமிழ் பிரச்சினை ஒருங்குறியில் தீரும் என்று பெரும் நம்பிக்கை. ஒருங்குறி என்பது வெறும் font மட்டும் அல்ல. அதற்கு மேலே ஒரு கணினியின் அடித்தள தகுதரம். அத்திவரத்திலேயே தமிழில் குளருபடியென்றால், சுவர்கள் எழுப்ப முடியாதென்றில்லை; ஆனால் weak ஆக இருக்கும். இப்படிப் பட்ட ஒருங்குறியிலேயே தமிழ் தெரியவில்லை சில மென்பொருளில். மற்றய மொழிகள் தெரியும் போது ஏன் தமிழ் தெரியவில்லை. நான் நினைத்தேன், தமிழ் உண்மையிலேயே ஒரு கடின மொழி. உயிர், மெய், நெடுங்கணக்கு என்று ஏதோ எதோ இருப்பதால், தமிழ் இவ்வாறு பிரச்சினையாய் இருக்கிறது என்று. எனக்கு மட்டும் அல்ல, எனக்கு தெரிந்த வரையில் ஒருவருக்கும், தமிழின் கணினித் துரோகம் தெரிந்திருக்க வில்லை. உங்களுக்கும் தெரிந்திருந்ததோ தெரியவில்லை. பலர், தமிழை கணினியில் சும்மா…