Tamil Unicode
-
தமிழ் ஒருங்குறி ?! -8
ஓம் தமிழில் முதலிலேயே ஏற்றவில்லை என்பது அல்ல எனது வாதம். ஒவ்வோர் மொழிக்கும் ஒவ்வோர் சிறப்பு எழுத்துக்கள் இருக்கின்றன. அவை அம்மொழிக் காரர்களே ஏற்ற வேண்டும். இதில் ஓம் ஏன் முதலிலேயே இல்லை என்பது ஒரு குற்றமே அல்ல. ” ஒவ்வொரு சாப்ட்வேரும இடிக்கிறதென்றால், நாம் ஏன் ஓபன்சோர்ஸ் அமைப்பு ஒன்றை அமைத்து பேட்சுகள் தயாரித்து வழங்கக் கூடாது? அல்லது சம்பந்தப் பட்ட நிறுவனங்களிடம் சுட்டிக்காட்டக்கூடாது? ” ஐயா, அது இடிக்காமல் முதலிலேயே செய்ய வழி இருந்தும் செய்யவில்லை என்பது தான் எனது வாதம். பூச்சியை தோழில் விட்டு விட்டு, ஐயோ பூச்சி ஐயோ பூச்சி என்று சிலர் கத்துகிறார்கள்[ people who say, tamil is not visible in all softwares]. பூச்சி தோழில் உள்ளது, இதற்காக நாங்கள் எல்லோரும் ஒரு கவசம் அணியலாம் என்கிறார்கள் வேறு சிலர் [people who say we can correct this with a new algorithm] பூச்சி தோழில் உள்ளது, எனது கவசம் உனது…
-
Tamil Unicode ?! -7
– Latin characters are in the order of English language [English characters are latin] Devanagiri characters are in the order of Hindi language [even though other languages uses Devanagiri script, the order is in Hindi] – Latin script has all character encoding [ accents of English, French, German.. etc] – Chinese, Japan, Korea has all character encoding. All south indian scripts are arranged accordingly for the order of Hindi language [in Devanagiri script]. People who knows Hindi can see it yourself. Every South Indian letters were exactly placed at the same place as Hindi language [again even though its Devanagiri, its NOT in the order of any other languages that…
-
Tamil Unicode ?! -6
Tamil will be visible in the future. Tamil will be sortable or able to process or do anything else in the future. But to do that it will take few years. WHAT MY WHOLE POINT IS, This drawback wouldn’t have needed IF Tamil is encoded CORRECTLY in the Unicode. As I have already point out, Tamil letter names are given Hindi [or other names]. Like Aytham is as “TAMIL SIGN Visarga”. puLLi as “TAMIL SIGN ANUSWARA”, and there is a 2nd puLLi named as “TAMIL SIGN VIRAMA” [The official version: http://www.unicode.org/charts/PDF/U0B80.pdf ] Tamil mey letters are not there [k, ng, ch, N, th, etc.]. It is seperated as “ka” and…
-
தமிழ் ஒருங்குறி ?! -5
எதிர்காலத்தில் ஒருங்குறியிலேயே சகல கணினி செயற்பாடுகளும் இருக்கும். தற்சமயம் ASCII இருக்கும் முறை மாற்றப்பட்டு வருகிறது. எதிர்காலத்தில் நீங்கள் india.com, tamil.com என்று ஆங்கிலத்தில் இணையத்தள முகவரி இடாமல் இந்தியா.காம், தமிழ்.காம் என்றே தமிழில் எழுதுவதற்கு இந்த ஒருங்குறி தான் காரணம். சீன இனத்தவர் சீன மொழியில் இணயத்தள முகவரி உருவாக்கும் போது நாம் ஆங்கிலத்தில் தான் உருவாக்கிக்கொண்டிருப்போம் என்பது மறுக்கமுடியாத உண்மை. உலகத்திலுள்ள அனைத்து வலையக சேவை தருபவர்களும் தமிழ் போன்ற இரண்டாம் ரக ஒருங்குறி செயற்பாட்டிற்கு அனுமதி தரும்போது மாத்திரமே, நாமும் தமிழில் இணையத்தள முகவரி உருவாக்கலாம். இதற்கு எவ்வளவு காலம் எடுக்கும்; அப்போது உலகிலுள்ள மற்றய மொழிகள் எவ்வளவு வளர்ச்சி பெற்றிருக்கும்; மற்றய மொழிகளில் ஏற்கனவே எவ்வளவு resources உருவாகியிருக்கும்; முக்கியமாக எவ்வளவு பேர் தமிழை விரும்புவார்கள் மற்றய மொழிகளை விட என்பது எதிர்காலந்தான் விடை தர வேண்டும். Part – 06 >> << பாகம் – 04 _____ CAPital
-
தமிழ் ஒருங்குறி ?! -4
சிறிது காலத்திற்கு முன் நான் முழுத் தமிழில் ஒரு web application, அதாவது ஒரு பரம்பரை ஏடு [family tree] ஒன்றை Database இல் செய்ய எத்தணித்தேன். Database table name, field name, description, SQL query என்று சகலதிலையும் தமிழிலேயே செய்ய எத்தணித்தேன் இந்த ஒருங்குறி மூலம். எனது இந்த மென்பொருளை வேறொறுவர் மாற்றியமைப்பதாக இருந்தால், அவர் கட்டாயமாக தமிழ் எழுதப் படிக்க தெரிந்தவராக இருத்தல் வேண்டும் என்று ஒரு சின்ன முயற்சி. அப்போது தான் கவனித்தேன், சில இடங்களில் [interface] தமிழ் சரியாகத் தெரியும், மற்றய இடங்களில் வெறும் பெட்டிகள் தான் தெரியும். இது என்ன Microsoft ஒருங்குறியை பிழையாக ஏற்றிவிட்டதா என்று ஒரு முட்டாள்தனமான எண்ணம். அன்று தொடங்கியது எனது ஒருங்குறியின் பாவனைத் தேடல். சகல interface களிலும் மென் பொருளின் விசேட உதவி தேவை, எமது தமிழை சரியாக அது பாவிப்பதற்கு. Microsft எல்லா இடங்களிலும் இவ் விசேட உதவி வழங்கவில்லை. மேலும் தெரிந்து கொண்டது தான்; இந்தியா…
-
தமிழ் ஒருங்குறி ?! -3
உலக மென்பொருளாளர்கள் ஒருங்குறிக்கு மாறிவிட்ட நேரத்தில், நீங்கள் போய் தமிழ் முழுக்கப் பிழை; முழுக்க மாற்று என்று சொன்னால் அவர்கள் செருப்பால்தான் அடிப்பார்கள். இந்தியா தன் மொழிகளுக்கு செய்த துரோகத்தால், நாம் அவதிப்பட்டே ஆக வேண்டியது நியதி. பலர் இதற்கு சொல்லலாம் இல்லை தமிழும் நன்றாக தெரிய வைக்கலாம் என்று. ஆமாம் நன்றாக தெரியும்; ஆனால் தமிழை கணினியில், தெரிய வைக்க, சேமிக்க, வரிசைப்படுத்த [sorting], சுருக்க [zip] என்று சகல வழிகளிலும் ஒரு மேலதிக செயற்பாடு தேவை. இதே ஃகிந்திக்கு இவை தேவை இல்லை (அ) குறவு. 3 எழுத்துக்களே ஆன “அம்மா” என்ற சொல்லில் 5 ஒருங்குறிகள் உள்ளன. இப்படிப் பார்த்தால் தமிழை சேமிக்க உங்களுக்கு மேலும் அதிக இடம் தேவை. “க்” = என்பது 2 ஒருங்குறி [ க என்பது ஒன்று, புள்ளி ஒன்று]; ஐயா தமிழில் “க” என்பது மெய்யல்ல. “க்” என்பது தான் மெய். ஒருங்குறியின் கோட்பாடுகளில் கூறப்பட்டுள்ளது அடிப்படை எழுத்துக்களே சேர்க்கவேண்டும் என்று. ஃகிந்திக்கு ஏற்றவாறு…
-
தமிழ் ஒருங்குறி ?! -2
” தட்டச்சு எந்திரத்தில் செய்வதுபோல ஒருங்குறியில் வைக்கப்பட்டுள்ளது. அவ்வளவுதான் ” இன்னும் பழங்காலத்திலேயே இருக்கத் தான் விருப்பமோ? ஒருங்குறி தவிர்ந்த ஏனைய குறியேற்றங்களில் தமிழில் உள்ள எல்லா எழுத்துக்களும் சேர்ப்பதற்கு அங்கு இடமிருக்கவில்லை [7-பிட், 8-பிட்]. இடமில்லாதபடியால், அவர்கள் ஒரு தந்திரமாக அவ்வாறு உபயோகித்தார்கள். அதையே பின்பற்றவேண்டும் என்பது அபத்தமாகவே படுகிறது. சரி, மற்றய எழுத்துக்கள் போடாவிட்டாலும் மெய், உயிர் ஆவது வரிசையாக ஏற்றியிருக்கலாமே. “க்” ஐப் பிரித்து “க” என்றும் “புள்ளி” என்றும் மெய்யில்லாமல் ஏற்றி, அவற்றை ஒழுங்குமாறி வேறு வைத்திருக்கிறார்கள். “புள்ளி” யின் பெயர் “அனுஸ்வரா” என்றும், இன்னுமொருமுறை “விரமா” என்றும் “ஃ” விசர்கா என்றும் தான் இருக்கிறது. கீழே உள்ள மின்வலைய முகவரிக்குச் சென்று பார்க்கவும். இது தான் ஒருங்குறி ஒன்றியத்தின் மிகவும் புதிதான தாழ் [Official latest version]. http://www.unicode.org/charts/PDF/U0B80.pdf ” பழைய பிங்கலந்தைப் பெயர் ஆகிய விராமத்தை புள்ளிக்கு யுனிகோட் வழங்கியுள்ளது. ” ஒருங்குறி ஒன்றியத்தின் மீது பழி சுமத்துவது போல் தெரிகிறது. ஒருங்குறி ஒன்றியம், இது தான்…
-
Tamil Unicode ?! -1
ISCII is centralized on HINDI script. Even though its Devanagiri, the order of characters is based on Hindi not any other languages that uses Devanagiri. Hindi language gets all the facilities of binary sorting while no other Indian scripts gets it. Indian government blindly gave the ISCII to UNICODE. So still other Indian languages doesn’t get the facility of binary sorting. The characters are not in order. In English encoding, the alphabet is in correct order. It also has the facility of converting from lower case to upper easily in binary. The very disturbing fact is that our language needs sophisticated processing to display/ sort/ and store in Unicode, the…