Translating Tamil songs isn't entirely there yet....

by Michael S. Kaplan, published on 2011/06/23, original URI: http://blogs.msdn.com/b/michkap/archive/2011/06/23/10177947.aspx


I am so predictable, I really am.

Like when I saw Google Translate welcomes you to the Indic web on the Google Blog, wasn't the ideathat I would respond by blogging about it kind of a foregone conclusion?

I decide to start by taking பிறப்பொக்கும் எல்லா உயிர்க்கும் (Pirapokkum ella uyirkum), the song I talk about in The song starts something like "All are equal at birth, they should all live as one race...", and translate it.

Of course the site is an Alpha version, as their link says:

You can expect translations for these new alpha languages to be less fluent and include many more untranslated words than some of our more mature languages—like Spanish or Chinese—which have much more of the web content that powers our statistical machine translation approach. Despite these challenges, we release alpha languages when we believe that they help people better access the multilingual web. If you notice incorrect or missing translations for any of our languages, please correct us; we enjoy learning from our mistakes and your feedback helps us graduate new languages from alpha status. If you’re a translator, you’ll also be able to take advantage of our machine translated output when using the Google Translator Toolkit.

Remembering that, the goal is not poetry -- it is understandability....

It starts with something like "All living humans are one in circumstances of birth" and goes from there, right?

And this site would be the way to take communication in Tamil and make it understandable to those who do not know Tamil.

Here is the orginal Tamil and the translation as of a couple of hours ago, for your perusal:

Original text Transliteration Google Translate text

பிறப்பொக்கும் எல்லா உயிர்க்கும் -
பிறந்த பின்னர்,
யாதும் ஊரே யாவரும் கேளீர்

உண்பது நாழி உடுப்பது இரண்டே
உறைவிடம் என்பது ஒன்றே என
உரைத்து வாழ்ந்தோம் – உழைத்து வாழ்வோம்

தீதும் நன்றும் பிறர்தர வாரா எனும்
நன்மொழியே நம் பொன் மொழியாம்
போரைப் புறம் தள்ளி
பொருளைப் பொதுவாக்கவே
அமைதி வழி காட்டும்
அன்பு மொழி
அய்யன் வள்ளுவரின் வாய்மொழியாம்

செம்மொழியான தமிழ் மொழியாம்…

ஓரறிவு முதல் ஆறறிவு உயிரினம் வரையிலே
உணர்ந்திடும் உடலமைப்பை பகுத்துக் கூறும்
ஒல்காப் புகழ் தொல்காப்பியமும்
ஒப்பற்ற குறள் கூறும் உயர் பண்பாடு
ஒலிக்கின்ற சிலம்பும், மேகலையும்
சிந்தாமணியுடனே வளையாபதி குண்டலகேசியும்

செம்மொழியான தமிழ் மொழியாம்…

கம்ப நாட்டாழ்வாரும்
கவியரசி அவ்வை நல்லாளும்
எம்மதமும் ஏற்றுப் புகழ்கின்ற
எத்தனையோ ஆயிரம் கவிதை நெய்வோரும்
புத்தாடை அனைத்துக்கும்
வித்தாக விளங்கும் மொழி

செம்மொழியான தமிழ் மொழியாம்…

அகமென்றும் புறமென்றும் வாழ்வை
அழகாக வகுத்தளித்து
ஆதி அந்தமிலாது இருக்கின்ற இனிய மொழி -
ஓதி வளரும் உயிரான உலகமொழி
நம் மொழி – நம் மொழி – அதுவே

செம்மொழியான தமிழ் மொழியாம்…

தமிழ்மொழி – தமிழ்மொழி – தமிழ்மொழியாம்
தமிழ் மொழியாம் – எங்கள் தமிழ் மொழியாம்
வாழிய வாழியவே… தமிழ் வாழிய வாழியவே…
செம்மொழியான தமிழ் மொழியாம்…




 

Pirapokkum ella uyirkum
pirandha pinnar

yaddhum ooreee yaavarum kellirrr

onnbadhu naazhi udupathu irende

uraividam enbadhu ondre

uraithu vazhndhom uzhaithu vazhvom..

theedhum nandrum pirar thara vaarai yenum
nan mozhiye nam pon mozhiyaam

porrai puram thallzhi porulai podhuvaakave..

amaidhi vazhi kaatum anbu mozhi
ayyan valluvarin vaaimozhiyaam

SEMMOZHIYAANA TAMIZH MOZHIYAAAM

orrarivu mudhal aararivu uyirinam varayile
unarndhidum udal amaipai pagirthu koorum

orrarivu mudhal aararivu uyirinam varayile
unarndhidum udal amaipai pagirthu koorum

thozhgapugal thozhgapiyamum
oppatra kural koorum uyar panpaadu

olikindra silamubum meghalayum sindhamaniyudane..

vazhayapathi kundalakesiyumm..

SEMMOZHIYAANA TAMIZH MOZHIYAAAM

kamba naataalvarum kavi arasiyevai nallaalum
yemmadhamum yetrum puzhgal endrum
yethanayo aayiram kavidhai neivor tharum
thadai anaithukkum vithaaga vilangum mozhi

SEMMOZHIYAANA TAMIZH MOZHIYAAAM

aagam endrum puram endrum
vazhvai azhagaaga vaguthalithu
aadhi anddam illathu irukindra iniya mozhi
modhi vazharum uyiraana uzhaga mozhi
thamm mozhi namm mozhi
adhuve...

SEMMOZHIYAANA TAMIZH MOZHIYAAAM

tamizh mozhi tamizh mozhi tamizh mozhi ya ghaaa...

SEMMOZHIYAANA TAMIZH MOZHIYAAAM

Thamizh Mozhiyam Engal Thamil Mozhiyam

Vazhiya Vazhiya ve..Thamizh .. Vazhiya Vazhiya ve

SEMMOZHIYAANA TAMIZH MOZHIYAAAM

Pirappo of all life -
After birth,
No Information

Now now only eating utuppatu
That is the only shelter
Uraittu lived - working live

Pirartara titum bad as well
Our golden nanmoliye moliyam
Away at war
Potuvakkave item
Quiet way
Love language
Ayaan's vaymoliyam valluvar

Moliyam cemmoliyana Tamil ...

The first creature orarivu ararivu varaiyile
Shape analysis and confirmed unarntitum
Tolkappiyamum olka fame
Rate this unique element of high culture
Olikkinra cilampum, mekalaiyum
Projects cintamaniyutane kuntalakeciyum

Moliyam cemmoliyana Tamil ...

Thanmalwila nattalvarum
Well kaviyaraci Avvai
Load praising emmatamum
Neyvorum many thousand poetry
Refresh all
Vitt, as a language

Moliyam cemmoliyana Tamil ...

Puramenrum life akamenrum
Beautiful vakuttalittu
My language is antamilatu Adi -
Oti developing codenamed ulakamoli
Our language - our language - it

Moliyam cemmoliyana Tamil ...

Tamilmoli - tamilmoli - tamilmoliyam
Moliyam Tamil - Tamil moliyam us
Tamil Site Support Site Support ... ...
Moliyam cemmoliyana Tamil ...









Perhaps we have not hit completely understandability just yet.

Well, let's just call it a work in progress. We'll try back in a month or three and see if there are any improvements.

In the meantime, I can still point out that I am completely in love with Shruti Hassan's voice, for those following along with that kind of thing.... :-)


comments not archived

Please consider a donation to keep this archive running, maintained and free of advertising.
Donate €20 or more to receive an offline copy of the whole archive including all images.

go to newer or older post, or back to index or month or day