Model Interpretatif dan Penerjemahan oleh Mesin


Oleh Mathieu Guidere - Master dalam bahasa dan sastra Arab serta Ph.D dalam Studi Penerjemahan dan Linguistik Terapan dari Universitas Paris-Sorbonne, Universitas Lyon 2 - France Saint-Cyr Research Centre, Prancis.

Penerjemahan telah menjadi bagian dari studi linguistik dalam kurun waktu yang cukup lama, (lihat karya-karya G. MOUNIN). Namun demikian, dalam beberapa dekade terakhir, penerjemahan secara kelembagaan telah dihubungkan dengan “Ilmu-Ilmu Bahasa”, yang mewakili bidang yang luas dan sangat dinamis di mana interdisiplinaritas memainkan peran yang sangat penting.
Hubungan ini telah mengakibatkan berkembangnya ilmu penerjemahan (traductology atau studi penerjemahan) di dalam bidang Ilmu-Ilmu Bahasa yang tidak berurusan secara khusus dengan “penerjemahan” namun dengan “operasional dan proses penerjemahan”, yang mencerminkan perubahan perspektif yang diambil dalam mendekati obyek studi.
Tujuan kami adalah mengemukakan kisi-kisi analisis epistemologis bidang terkait yakni karya-karya yang berhubungan dengan studi analisis penerjemahan serta pemrosesan alamiahnya sebagai pendahulu penerjemahan oleh mesin atau penerjemahan yang dibantu oleh komputer. Namun demikian, menentukan sifat pokok sebuah bidang memerlukan satu atau beberapa perspektif untuk menentukan sumbu, persoalan, metode dan tujuannya.
Karenanya, pertama-tama garis-garis besar konflik teoritis yang luas antara persoalan arti dan penerjemahan akan ditetapkan. Selanjutnya kami akan menerangkan bagaimana konflik ini melampaui formalisasi logis. Tujuan merancang teori adalah untuk membebaskan pengajaran penerjemahan dari “model interpretatif”. Terakhir, berbagai persoalan ini kemudian akan dikaji ulang agar dapat menggunakan kembali data untuk pemrosesan bahasa alamiah (penerjemahan oleh mesin atau penerjemahan yang dibantu oleh komputer).
Untuk membangun kisi-kisi analisis, kita harus kembali pada tiga bidang dasar yang berhubungan dengan metodologi ilmiah: bidang observasi, bidang hipotesa dan bidang validasi (lihat karya-karya Auroux). Tujuannya di sini bukanlah untuk membandingkan pendekatan-pendekatan yang diamati atau mengungkapkan penilaian mengenai mereka; melainkan untuk menanganinya dari perspektif pemrosesan bahasa sebagai sebuah langkah sebelum penerjemahan, karena perspektif ini dan implementasinya merupakan bagian dari sebuah proses “obyektif”, artinya mereka hanya menyimpulkan penilaian tentang data spesifik. Dengan kata lain, kita pertama-tama dan terutama berhubungan dengan observasi, yang didukung dengan deskripsi dan data yang telah divalidasi, sehingga menempatkan karya-karya ini ke dalam perspektif dan menyusun bidang spesialisasi berdasarkan prinsip-prinsip yang diperkenalkan di bawah ini.
Pilihan-Pilihan Metodologis
Pilihan metodologis berhubungan dengan perspektif yang dipilih untuk menganalisa karya-karya mengenai penerjemahan dalam studi ini. Pilihan-pilihan tersebut menempatkan disiplin ilmu ini di persimpangan jalan antara linguistik teoritis dan empirisisme ilmiah, berdasarkan fakta bahwa dampak sebuah teori sepadan dengan aplikasi yang menjadi hasilnya. Untuk alasan ini, obyek penelitian, penerjemahan, akan ditangani dengan cara deskriptif, yakni sebagaimana yang dipraktekkan dan berkembang secara profesional. Namun demikian, obyek ini harus dijelaskan dengan berbagai protokol analisis baru dan secara imperatif harus beralih dari model interpretatif yang lazim.
Dengan mempertimbangkan dalil-dalil ini, kami hanya akan menerangkan karya-karya yang telah terbukti kebenarannya (kumpulan teks yang telah diterjemahkan dan diterbitkan) dan menggunakan apa yang dianggap sebagai unsur empiris yang dapat menjadi obyek pengujian “koroboratif” atau validasi di dalam karya-karya ini. Akan tetapi, tujuan ini tidak menghilangkan kemungkinan melakukan pengamatan jenis yang berbeda dengan menggunakan informasi yang tidak terdapat dalam kumpulan teks dan karya kita.
Data untuk analisis dapat dibagi ke dalam tiga kategori utama. Pertama, teks elektronik yang berhubungan dengan observasi. Kedua, sistem hipotesa dan indikasi yang terkomputerisasi. Terakhir, aplikasi validasi yang berhubungan dengan hipotesa dan data linguistik yang timbul dari observasi.
Karya kita intinya didasarkan pada tiga perangkat: teks elektronik yang dikelompokkan ke dalam kumpulan tulisan yang dapat dibaca mesin, perangkat kerja untuk mengamati dan mengklasifikasikan data linguistik serta perangkat koroboratif untuk memvalidasi hasil-hasil observasi.
Kumpulan teks yang digunakan dalam penelitian ini harus sesuai dengan istilah Sinclair. Observasi data linguistik harus menghasilkan penyusunan obyek penelitian sesuai dengan protokol penyimpulan yang spesifik dan berkelanjutan. Hasil yang timbul dari observasi haruslah “luar biasa”, artinya mereka harus mengungkap penggunaan dan kejadian yang memiliki frekuensi tinggi dalam korpus referensi. Konsekuensinya, perhatian kita beralih pada karya-karya final nyata (teks, kalimat, ungkapan, istilah) dan bukan pada penggunaan bahasa (berbicara, menulis, mengingat). Gagasannya adalah pengkajian data yang teliti yang menjadi sebuah keharusan tidak dapat dilakukan pada praktek-praktek tuturan ini dan hanya karya-karya yang diamati saja yang memungkinkan diterapkannya prosedur-prosedur yang obyektif. Namun hal ini tidak berarti bahwa semua yang diamati tidak mengungkap apa yang terjadi di dalam pikiran pembicara. Pemisahan antara “data” dan “praktek” ini menemukan pasangannya di bidang ilmu komputer, dalam pemisahan antara “deklaratif” dan “prosedural”. Untuk saat ini, kita harus memutuskan jenis data apa yang harus diamati dan, secara lebih khusus, frasa dan istilah apa yang menjadi obyek potensial penelitian penerjemahan yang sistematis.
Hingga saat ini, pendekatan kita didasarkan pada dalil yang telah diverifikasi secara empiris bahwa teks korpus yang digunakan untuk mengkaji data yang mewakili frasa lebih lanjut dan yang sesuai dengan tata bahasa memiliki hubungan dengan hambatan spesifik, sehingga memungkinkan kita untuk membedakan konstruksi wacana dari rangkaian frasa kacau yang tidak memiliki koherensi dan konsistensi.
Titik awal ini sangatlah penting karena ia memberi penekanan yang besar, dalam observasi dan analisis, pada arti penting linguistik tekstual dibandingkan dengan linguistik teoritis dan umum. Ini artinya kita berusaha mencapai beberapa tujuan: pertama, mengenali sebuah teks dari rangkaian frasa yang tidak memiliki hubungan logis maupun semantis di antara keduanya, kedua, menandai isi teks dari sudut pandang tipologis (teknis, jurnalistik, dan sebagainya) dan terakhir, mengklasifikasikan informasi yang disarikan menurut kriteria linguistik dan protokol yang telah ditetapkan sebelumnya.
Untuk meraih semua tujuan ini, tidak hanya metodologi observasi harus diadopsi namun hasilnya pun harus diungkapkan dalam bahasa yang tepat. Oleh karena itu, di satu sisi, kita harus belajar mengamati frasa berdasarkan tiga tingkatan analisis (morfologis, semantis, sintaktis) dan, di sisi lain, hubungan antara frasa berdasarkan jenis wacana (model argumentatif atau anafora tekstual).
Begitu metodologinya telah diadopsi, beberapa hipotesis karya dapat dibuat seraya mengacu pada tiga sumbu utama: pertama, jenis formalisme yang digunakan, kedua, portabilitas atau perpanjangan linguistik dan terakhir sasaran atau tujuan analisis. Terkait dengan sumbu yang pertama, pilihan diambil untuk menjadikan hasilnya lebih eksplisit saat menyiapkan hipotesis dalam bentuk yang dapat dikomputerisasi, yakni yang akan diwakili oleh algoritma dan dibaca oleh mesin. Inilah kekhasan “formalisasi” di mana kita ingin bersikap spesifik terhadap hambatan proses penerjemahan.
Dalam hal ini, ada dua cara “memformalkan” data linguistik: yang pertama benar-benar bebas dari perangkat terkomputerisasi yang mengolah data lebih lanjut dan menggunakan petunjuk yang eksplisit dalam bentuk aturan standar; yang lainnya didasarkan pada kemungkinan formal algoritma yang dapat dibaca mesin untuk mewakili informasi linguistik. Namun demikian, kedua cara ini seringkali saling melengkapi sehingga kita harus memulai dengan cara yang pertama sebelum menangani yang kedua. Pada kedua kasus, formalisme linguistik yang dapat dibaca oleh mesin akan diperoleh pada akhir prosedur.
Terkait dengan sumbu kedua, kami memutuskan untuk memilih, sebagai titik awal, sebuah teks sumber (ST) dan, sebagai titik akhir, sebuah teks target (TT) untuk mengkaji, dengan cara yang kontras, interaksi mereka melalui berbagai struktur yang memiliki kompleksitas yang berbeda yang perlu diterangkan dan disarikan. Begitu struktur tersebut diterapkan pada ST, sesuai dengan protokol yang spesifik, ia cukup dicari dan divalidasi dalam TT. Karenanya, ini merupakan sudut pandang perpanjangan linguistik yang “berorientasi pada sumber”.
Perlu disebutkan pada titik ini bahwa studi penerjemahan membedakan dua sudut pandang dalam praktek dan analisis penerjemahan: sudut pandang “berorientasi sumber” yang mendukung kekhususan dan persyaratan yang khas pada teks sumber (kesetiaan, keharfiahan) dan sudut pandang “berorientasi target” yang mendukung teks target (penyusunan kembali kata, adaptasi).
Terkait dengan sumbu ketiga (tujuan analisis), harus dicatat bahwa kita telah memiliki “input” dan “output”, yakni kita sudah tahu hasil operasi bahkan sebelum memulai formalisasi dan implementasi program karena mengerjakan kumpulan teks yang telah diterjemahkan dan disinkronisasikan sebelumnya. Sasaran aplikasi ini adalah menunjukkan bahwa program berjalan sesuai dengan spesifikasi yang diberikan. Dengan kata lain, implementasi program adalah prosedur validasi untuk hasil-hasil pengamatan.
Mengingat unsur-unsur ini, perlu disebutkan bahwa di bidang penerjemahan oleh mesin (MT), persoalan “perpanjangan linguistik” sangatlah penting dan membuat kita harus memikirkannya. Hal ini bisa dinyatakan sebagai berikut: Di dalam sistem linguistik A, informasi yang berhubungan dengan sub-kelompok unit terjemahan (kalimat dan ungkapan) yang menunjukkan keteraturan dan koherensi tertentu akan dapat disistematisasi dan dikomputerisasi. Pertanyaannya adalah mengetahui apakah sifat sistem A, ketika mempertahankan koherensi pokok yang sama, dapat diperluas ke sistem B sedemikian rupa sehingga unit sumber terjemahan memiliki padanan yang memadai dalam bahasa target. Apabila hal ini dimungkinkan dan modifikasi yang diperkenalkan tidak mempengaruhi koherensi internal sistem B, kita mungkin bisa mengatakan bahwa sistem A dan sub-kelompok unitnya secara linguistik dapat diperluas, artinya mereka dapat dipindahkan dengan penerjemahan yang terkomputerisasi.
Mari kita ambil contoh yang dapat diterangkan secara memadai dengan tata bahasa terlepas dari kompleksitas dan ambiguitas semantisnya. Kalimat “Menteri Pendidikan bertemu dengan mitra Dalam Negerinya” dapat dengan mudah diterjemahkan oleh manusia dalam bahasa apapun. Namun demikian, agar dapat diterjemahkan dengan mesin, sifat linguistiknya harus dapat diperluas ke sistem yang akan menerimanya. Pada kasus khusus ini, sebagai contoh, “frasa posesif” (konstruksi genitif dalam bahasa Arab) harus dapat dipindahkan dan elipsis pada frasa berulangnya (menteri bidang tertentu) harus dapat diterima pada kedua kasus tanpa modifikasi besar. Selanjutnya, persoalan “predikasi” menimbulkan masalah yang rumit terkait dengan “portabilitas” dalam dua sistem linguistik yang berbeda seperti halnya bahasa Inggris dan Arab.
Agar masalah kesesuaian antara kedua bahasa dapat diatasi, indikasi linguistik yang sangat terperinci harus disediakan untuk meraih tingkat formalisasi lebih lanjut sebagai awal menuju komputerisasi.Oleh karena itu, sistem kesepadanan yang dapat dibaca oleh mesin merupakan sebuah rangkaian formula linguistik di mana setiap formula menentukan setidaknya satu pasangan frasa (lihat perspektif holistik penerjemahan).
Sebagai contoh, mari kita ambil rangkaian ungkapan (SES) dalam teks sumber (TEX) sehingga setiap ungkapan (EXP) dapat dihubungkan dengan satu atau beberapa indikasi (IND) yang serupa untuk semua ungkapan (EXP) pada rangkaian (SES) dalam teks (TEX). Hal ini menyediakan formula sebagai berikut: SES = (IND, EXP,TEX).
Berdasarkan formula ini, formula yang sepadan, yang berlaku untuk teks target, dapat diperoleh: SES1 = {IND1, EXP1, TEX1}. Formula ini dapat dibenarkan dalam kaitannya dengan rangkaian ungkapan yang memiliki kesamaan sifat-sifat linguistik yang relevan dalam teks target tanpa harus sepadan dengan yang ada pada teks sumber pada tingkat struktural. Tidak ada proyeksi sistematis sifat-sifat satu sistem ke sistem yang lain. Jika ada proyeksi, hal ini harus dilakukan sesuai dengan prinsip tata bahasa yang perumusannya tunduk pada perhitungan (formal maupun algoritmis) yang mendasari seluruh ungkapan dalam teks. Dengan cara ini, sifat linguistik dapat atau tidak dapat diproyeksikan, dengan cara yang sama di mana sistem dapat atau tidak dapat diportabelkan, terkait dengan kemungkinan atau kemustahilan menerjemahkan rangkaian dari satu bahasa ke bahasa yang lain.
Dengan mengadopsi sudut pandang “formalis” dalam penerjemahan, kriteria eksplisit untuk perbandingan teks diletakkan, masing-masing dianalisa dan diungkapkan dalam bentuk persamaan yang memadai. Menurut metode analisis penerjemahan ini, tidak ada “kesepadanan” antara bahasa melainkan hanya merupakan “kesesuaian” struktur dan sifat-sifat linguistik. Berbeda dengan “kesepadanan” yang dapat dianalisis menurut kriteria kesamaan, “kesesuaian” merupakan pasangan obyek yang berbeda dalam tingkatan bentuk namun sebanding pada tingkatan fungsi.
Ditampilkannya “kesesuaian-kesesuaian” ini, yang mencakup ketidaktepatan semantis, utamanya berasal dari pilihan-pilihan yang dibuat selama tahap observasi. Unsur perbandingan apa yang harus diambil? Tentu saja, kita mengecualikan dari kriteria kita pertimbangan subyektif tentang “keindahan” atau “keelokan” penerjemahan yang akan digunakan untuk penerjemahan oleh mesin.
Garis-Garis Besar Pendekatan yang Diambil
Pendekatan kita dapat dihubungkan, dari sudut pandang teoritis, dengan linguistik tekstual menggunakan prinsip kontrastivitas dan formalisasi yang signifikan.
Di dalam kerangka kerja pendekatan ini, teks yang diambil sebagai cadangan penelitian diklasifikasikan menurut sumber-sumber yang telah membuat dan mendistribusikan mereka (contohnya makalah atau badan resmi) dan menurut bidang denotatif mereka berdasarkan pertimbangan semantis eksplisit (contohnya, teks-teks mengenai persoalan hukum atau kesehatan).
Begitu bidang dan jenis teks telah ditetapkan dengan baik, observasi akan berfokus, di satu sisi, pada segmentasinya dan pada unsur sintaksnya (“chunk”) dan di sisi lain, pada hubungan antara unsur-unsur tersebut dari sudut pandang morfologis dan semantis.
Perhitungan yang melandasinya memastikan validasi pendekatan ini dari sudut pandang teoritis maupun praktis. Karenanya, pilihan unit-unit tekstual yang akan dianalisis dan diformalkan harus dibuat menurut konsep-konsep spesifik seperti “perulangan”, “cakupan” dan “ketepatan”. Statistik digunakan untuk mendeteksi penggunaan linguistik dan penerjemahan struktur yang paling sering dalam korpus penelitian dan untuk menyusun deskripsi yang harus memberitahu kita tentang unsur yang paling relevan.
Karenanya, observasi berurusan dengan yang dapat diakses seketika dalam frasa yang diteliti, sedangkan semantik tidak ditangani pada titik ini. Penggunaan kumpulan pelatihan dan pengenalan deskripsi berada di pusat pendekatan tekstual. Tahapan-tahapan utama analisis adalah sebagai berikut (penalaran dari fakta-fakta khusus menuju kesimpulan umum):
1) Analisis morfologis dan segmentasi;
2) Disambiguasi kategori morfologis;
3) Analisis sintaktis lokal dan tekstual;
4) Analisis hubungan sintaktis fungsional.
Kesulitan utama analisis sebelum penerjemahan masihlah disambiguasi konteks tekstual asli. Kesulitan ini pada hakikatnya berhubungan dengan masalah penentuan sifat kalimat guna menghilangkan potensi hubungan sintaktis untuk jenis aturan tertentu (yakni aturan morfo-sintaktis atau “aturan chunking”). Masalah ini menjadi jauh lebih menonjol selama analisis teks oleh mesin karena kesulitan yang timbul dari ambiguitas penandaan morfo-sintaktis digabungkan dengan yang dari segmentasi). Dengan formalisme saat ini, cukup sulit untuk secara otomatis mengurangi dihasilkannya “analisis intrusif” yang pastinya akan menjadi masalah selama penerjemahan (lihat karya-karya Chanod).
Bagaimanapun, penelitian linguistik tekstual membuka jalan menuju proses induktif penerjemahan. Saat ini dimungkinkan untuk merumuskan generalisasi induktif seperti pada “kesesuaian” linguistik yang diamati secara aktual. Namun demikian, untuk memajukan penelitian, menjadi sebuah keharusan untuk mengimplementasikan pengujian koroboratif secara sistematis agar dapat mengukur validitas aturan yang diadopsi.
Batas Penafsiran dalam Penerjemahan oleh Mesin
Salah satu persoalan mendasar terkait dengan pendekatan penerjemahan masih berkisar tentang prinsip-prinsip yang memungkinkan penafsiran arti yang akan diterjemahkan. Perspektif yang diadopsi di sini untuk menganalisis terjemahan yang dianggap sebagai mekanisme penerjemahan spesifik yang turut terlibat dalam penafsiran frasa dan prinsip-prinsip umum yang berhubungan dengan penafsiran tidaklah memadai. Namun demikian, mekanisme ini harus diubah agar mempertimbangkan tanda-tanda linguistik (kala, modus, kata berkait, kosa kata verbal dan nominal) yang berkontribusi pada penafsiran frasa dan tuturan yang akan diterjemahkan.
Kami menyusun di sini sebuah kerangka kerja umum representasi formula, teori formalisme penerjemahan, dan model penerjemahan interpretatif, model deduksi kontekstual, untuk secara spesifik mengkaji pertanyaan kesepadanan penerjemahan. Kami akan menunjukkan bagaimana pendekatan ini dapat diterapkan pada pengolahan bahasa alami sebagai pendahuluan menuju penerjemahan (CAT dan MT). Faktanya, beberapa tahun yang lalu, arah baru linguistik dan semiotika mulai mendefinisikan ulang penafsiran dalam penerjemahan adan memandangnya sebagai tindakan kognisi yang melewati proses komparatif kemungkinan kesepadanan. Ide membetulkan penafsiran dalam penerjemahan memenuhi kebutuhan menyesuaikan observasi praktis menurut arah teoritis baru ini.
Untuk menetapkan unsur-unsur perdebatan, kita harus memulai dengan teks dari buku Umberto Eco, Les Limites de l’interprétation. Penulis mencatat, di dalam pendahuluannya, bahwa “beberapa orang mendorong inisiatif penafsir terlalu jauh sehingga persoalan saat ini adalah menghindar agar tidak jatuh pada kesalahan penafsiran”. Dan ia kemudian menambahkan dalam bukunya: “Setelah mempertimbangkan semuanya, mengatakan bahwa sebuah teks tidak memiliki akhir tidak berarti bahwa (setiap) tindakan penafsiran memiliki akhir yang bahagia”. Itulah sebabnya penulis berusaha memulihkan dialektika tertentu antara hak-hak pembaca-penerjemah dan hak-hak teks-yang-akan-diterjemahkan.
Dengan menggunakan pesan “Dear friend, in this basket brought by my slave, there are thirty figs I send you as a gift” (Sahabat, di dalam keranjang yang dibawa oleh budak saya, ada tiga puluh buah ara yang saya kirim sebagai hadiah), Umberto Eco memberi banyak makna dan rujukan, namun ia menegaskan bahwa kita tidak memiliki hak untuk mengatakan bahwa pesan tersebut bisa berarti apa saja. Pesan itu bisa berarti banyak hal namun akan sangat berbahaya untuk menyarankan sebuah arti. Menyatakan fakta ini berarti mengakui frasa tersebut memiliki arti harfiah: “Saya tahu betapa panasnya kontroversi dalam hal ini, namun saya masih berpendapat bahwa, di dalam batas bahasa apapun, ada arti harfiah untuk hal-hal leksikal, yaitu yang disebutkan pertama oleh kamus”. Eco mengatakan bahwa kita harus memulai dengan menetapkan semacam ayunan, keseimbangan yang tidak stabil, antara inisiatif penafsiran dan kesetiaan pada teks. Berfungsinya sebuah teks akan dapat dipahami dengan mempertimbangkan bagian yang dimainkan oleh pihak penerima dalam proses pemahaman, penyadaran, dan penafsiran serta cara teks itu sendiri memproyeksikan partisipasi pembaca.
Perdebatan penafsiran dalam penerjemahan didasarkan pada dua pendekatan: di satu sisi, mencari apa yang sebenarnya dikatakan oleh penulis dalam teks; di sisi lain, mencari apa yang dikatakan oleh penulis dalam teks, tanpa memandang maksudnya, baik dengan mengandalkan pada koherensi tekstual maupun pada sistem pengertian pihak penerima. Namun demikian, pada semua kasus, seseorang harus menggunakan arti harfiah untuk mengembangkan penerjemahan.
Kritik penerjemahan mencoba menerangkan alasan mengapa teks memberi arti pada yang terdahulu atau yang terakhir. Jumlah versi yang dapat dihasilkan oleh penerjemah berpotensi tidak terbatas namun, pada akhir proses ini, masing-masing harus diuji terkait dengan koherensi tekstual dan linguistik, guna menolak penerjemahan kira-kira yang tidak pasti. Oleh karena itu, sebuah teks bisa sesuai untuk banyak pembacaan namun tidak mengizinkan semua penerjemahan yang mungkin. Jika kita tidak bisa mengatakan terjemahan mana yang paling baik untuk sebuah teks, bagaimanapun, kita dapat mengatakan mana saja yang tidak benar. Setiap tindakan penerjemahan merupakan sebuah transaksi yang sulit antara kompetensi penerjemah dan jenis kompetensi di mana sebuah teks perlu diterjemahkan dengan cara yang teliti dan koheren. Di dalam niatan sang penulis yang tidak dapat dijangkau, apa yang sebenarnya ingin dikatakan olehnya, dan maksud pembaca-penerjemah yang dapat diperdebatkan, penafsirannya, terdapat arti transparan teks yang membantah penerjemahan yang tidak memadai atau yang tidak dapat diterima.
Sangatlah sulit untuk menentukan apa yang salah dan apa yang otentik dalam sebuah terjemahan, karena definisinya tergantung pada persoalan yang dibahas. Bagaimanapun, pada semua kasus, kondisi yang cukup memiliki arti yang tidak benar adalah pernyataan bahwa frasa dari teks sumber memiliki banyak padanan dalam teks target. Karenanya, penerjemahan tidak salah karena sifat internalnya melainkan karena identitas yang seolah-olah ganda antara sumber dan target.
Oleh karena itu, kalimat “All translators love foreign languages” (Semua penerjemah menyukai bahasa asing), misalnya, tidak memiliki banyak arti paralel namun ia menerima secara praktis beberapa kemungkinan penerjemahan. Di sisi lain, mustahil untuk secara logis menyimpulkan bahwa seluruh kesepadanan tersebut identik, secara struktural, dan tanpa memandang persepsi subyektif individu yang membuatnya.
Penerjemahan-penerjemahan yang berbeda ini bukan hanya sekedar susunan kata yang berbeda mengenai ide yang sama. Masing-masing struktur secara stilistika mengungkapkan arti yang berbeda. Konsekuensinya, kita tidak bisa mengatakan sebuah kalimat nominal dan verbal menyampaikan ide yang sama dan mengungkap arti yang sama, bahkan sekalipun kata-kata yang digunakan identik dalam kedua struktur. Kita tahu predikasi tidak sama pada kedua kasus karena kalimat nominal menekankan kata benda sedangkan kalimat verbal berfokus pada proses atau tindakan. Menyatakan dua terjemahan yang berbeda sepadan secara struktural dengan struktur asli ketiga sama dengan mengabaikan kekhususan struktur linguistik dalam mengungkap perbedaan-perbedaan kecil dan perbedaan arti yang halus. Agar merasa yakin dengan validitas observasi ini, “penerjemahan mundur” dapat digunakan sebagai kriteria pembeda antara penerjemahan. “Penerjemahan mundur” faktanya berarti penerjemahan ulang ke bahasa sumber, dari versi yang sudah diterjemahkan ke dalam bahasa target, tanpa menggunakan aslinya. Menerjemahkan mundur versi yang sudah diterjemahkan “secara buta” seringkali memungkinkan kita untuk mengetahui bahwa struktur kesepadanan bukanlah yang diambil sebagai titik awal penerjemahan, yang menunjukkan ketidakakuratan penerjemahan yang disebutkan di atas.
Istilah “kesepadanan yang mungkin” berguna untuk teori penerjemahan karena hal itu membantu memutuskan arti apa yang menarik bagi penerjemah dalam karyanya dan apa yang ingin disampaikan olehnya melalui bahasa. Namun kita harus menyadari fakta bahwa, di antara terjemahan yang mungkin, terdapat terjemahan pasti, terjemahan yang tidak mungkin, dan terjemahan yang tidak dapat diterima. Di dalam kalimat seperti: “All translators love foreign languages”, penerjemah harus memikirkan cara terbaik menafsirkannya dalam bahasa target. Ia pertama-tama akan berpikir dalam kaitannya dengan tiga tingkatan bahasa: morfologis, semantis, dan sintaktis. Terjemahan pasti akan mempertimbangkan tingkatan-tingkatan ini serta benar secara linguistik dan tepat secara budaya. Terjemahan yang tidak mungkin akan menjauh dari keakuratan harfiah pada penerjemahan yang berlebihan dari asliya atau menciptakan efek stilistika tertentu. Terakhir, terjemahan yang tidak dapat diterima akan memberikan versi yang berbeda secara semantis dari aslinya meskipun akurat secara linguistik.
Dalam hal ini, perbedaan harus dibuat antara “penerjemahan semantis” dan “penerjemahan kritis”. Yang pertama merupakan hasil teknik yang diadopsi oleh penerjemah ketika berhadapan dengan perkembangan linier teks, yang memberikan arti tertentu sesuai dengan kosa kata frasanya, sedangkan yang kedua merupakan aktivitas meta-linguistik yang bertujuan menerangkan dan menjelaskan, pada tingkat formal, mengapa sebuah teks tertentu memberikan terjemahan tertentu, dengan pengecualian semua yang lain, betapapun masuk akalnya.
Seorang penerjemah teladan tidak hanya harus tepat dan teliti namun juga harus benar-benar memperhatikan perbedaan halus secara stilistika pada kedua bahasa kerjanya berdasarkan prinsip setiap susunan kata memiliki arti dan tujuannya sendiri dalam sistem linguistik yang menggunakannya (prinsip “ekonomi bahasa”). Apabila seorang penerjemah teladan bertindak demikian, ia akan menghasilkan terjemahan konsensual tanpa pertimbangan nilai subyektif apapun. Jika tidak, ia akan dipaksa mencari kemungkinan arti dan cara potensial untuk menafsirkannya yang merupakan sebuah upaya yang sia-sia.
Beberapa penerjemah mungkin bertanya: “mengapa harus teliti jika artinya telah dipahami dan disampaikan?” Bagaimanapun, penerjemah semacam itu, yang bodoh atau ceroboh tergantung pada kasusnya, tidak akan menjadi penerjemah teladan, karena mereka mencari arti eksak dan penerjemahan pasti, yang kemungkinan akan diambil dan dijadikan model untuk pemrosesan alami bahasa. Namun bagaimana kita bisa meraih sasaran ini ketika berhadapan dengan begitu banyak bacaan dan penafsiran?
Menurut pakar semiotika Peirce, penafsiran arti merupakan tindakan yang melibatkan kerjasama tiga subyek: tanda (misalnya: kata mawar), obyeknya (bunga nyata yang berwujud) dan interpretant-nya (konsep bunga berwarna merah). Hal yang penting dalam definisi Peirce adalah ia tidak memperhitungkan penafsir atau subyek yang sadar. Karenanya, harus diingat, sesuai dengan analisis Peirce dan Eco, betapa pentingnya perbedaan antara sistem arti (sistem tanda) dan proses komunikasi (membutuhkan kehadiran seorang penafsir). Sistem arti merupakan sebuah rangkaian unsur dengan aturan kombinasi yang mengatur disposisi unsur-unsur di antara mereka (sintaksnya). Susunan sistem sintaksis yang dapat diterima yang berhubungan dengan sistem lain dapat dipindahkan dari satu bahasa ke bahasa yang lain (contohnya: w+a+t+e+r = water = “drinkable transparent liquid” (a+i+r = air = “minuman transparan yang dapat diminum”) dapat dipindahkan dalam bahasa apapun di dunia tanpa menggunakan penafsiran manusia).
Di dalam sistem semiotika, konten apapun dapat menjadi sebuah ungkapan baru yang akan ditafsirkan atau diterjemahkan oleh ungkapan lain dalam bahasa lain. Abduksi adalah sebuah bentuk inferensi yang mencoba menafsirkan arti frasa secara akurat dan menetapkan aturan dengan menggunakan kata dan konteksnya. Mengakui sebuah rangkaian kata sebagai sebuah susunan yang koheren (yakni sebagai sebuah teks) berarti menemukan tema tekstual yang dapat menciptakan hubungan yang koheren di antara sejumlah data berbeda yang tidak memiliki hubungan di antara mereka. Identifikasi sebuah tema tekstual merupakan contoh abduksi. Setiap penerjemah membuat abduksi memilih antara berbagai kemungkinan pembacaan sebuah teks. Kriteria ekonomi bahasa memaksa kita untuk selalu memilih pilihan termudah jika tidak ada perangkat pemilihan lain.
Untuk Metodologi Penerjemahan Berbasis-Corpus
Metode yang diadopsi adalah metode linguistik formal namun pendekatan yang disarankan di sini didasarkan pada tiga dalil linguistik korpus:
Pertama, semua solusi penerjemahan sudah ada di dalam teks yang diterjemahkan.
Kedua, seluruh kesepadanan terjemahan akan dianalisis dan diformalisasi.
Ketiga, seluruh formalisasi disistematisasi dan dikomputerisasi.
Pendekatan ini terutama diterapkan pada teks-teks khusus (dengan kosa kata terkendali atau tertutup) dan kedua pada teks-teks umum (dengan kosa kata polysemous dan yang dikonotasikan). Kategori pertama terdiri dari mayoritas literatur yang diterjemahkan saat ini, sedangkan bahasa sastrawi (atau puitis) mewakili sebagian kecil penggunaan diskursif dalam kumpulan teks tekstual.
Pendekatan ini bertujuan menentukan terjemahan yang akan diformalkan. Untuk mengidentifikasi solusi penerjemahan yang paling relevan, kami menggunakan perhitungan frekuensi kejadian: semakin sering sebuah kesepadanan muncul dalam teks yang diterjemahkan, semakin besar ia dianggap sebagai solusi yang pasti; semakin jarang muncul dalam terjemahan, semakin besar ia dianggap sebagai marjinal.
Kita bisa mengatakan, sebagai contoh, untuk kalimat “All translators love foreign languages”, ada lima cara berbeda untuk menerjemahkannya ke dalam bahasa Arab. Susunan kata yang paling sering akan dianggap sebagai pasti, tanpa memandang sifat instrinsiknya karena kita menganggap keberulangannya sebagai bukti validitasnya, dan juga legitimasinya. Tujuannya bukanlah untuk mengevaluasi kualitas terjemahan namun lebih untuk mencatat penggunaan terjemahan.
Karenanya, penerjemahan berbasis korpus didasarkan pada tiga prinsip atau presuposisi utama:
1) Prinsip imanensi: masing-masing pasangan teks membentuk unsur komposit penandaan yang sama; analisisnya mengkaji kedua teks namun hanya sebagai terjemahan satu sama lain; ia tidak mengandalkan pada data eksternal seperti informasi kamus atau tata bahasa.
2) Prinsip komposisi: Satu-satunya arti yang sebenarnya adalah melalui dan dalam hubungan antara kedua teks, terutama hubungan kesesuaian antara unit-unit terjemahan; karenanya, analisis “dwi-teks” terdiri dari menetapkan jaringan kesesuaian antara unsur-unsur yang berbeda, sebuah jaringan yang akan menjadi basis untuk penerjemahan teks.
3) Prinsip penstrukturan: setiap terjemahan mempertimbangkan tata bahasa dan logika diskursif, yakni jumlah aturan linguistik dan struktur dasar tertentu. Di dalam rangkaian unit yang dinamakan “terjemahan” terdapat tingkat kesesuaian yang berbeda, masing-masing dengan tata bahasanya sendiri.
Karenanya, konten global sebuah terjemahan dapat dianalisis pada tiga tingkatan yang berbeda:
1) Tingkat terjemahan: dalam sebuah terjemahan, kita mempelajari perubahan yang menyampaikan arti teks sumber ke teks target. Pada akhir proses penerjemahan, analisis berusaha menyusun kembali berbagai tahap berbeda, yang secara logis berhubungan satu sama lain, yang menandai transformasi kalimat ke dalam padanannya. Pada masing-masing tahap, kita menentukan hubungan antara fungsi-fungsi beberapa unsur frasa yang menentukan arti dan menghasilkan transformasi.
2) Tingkat diskursif: analisisnya melibatkan tiga operasional: (a) mengidentifikasi dan mengklasifikasikan susunan yakni unsur signifikan di dalam sebuah teks; (b) menetapkan padanan untuk masing-masing unsur dalam teks untuk menentukan bagaimana unsur ini diterjemahkan dalam teks; (c) menemukan mengapa unsur-unsur, dalam teks tertentu, diterjemahkan dengan cara demikian.
3) Tingkat logika-semantik: ini merupakan tingkat analisis yang paling abstrak. Ia bekerja berdasarkan dalil bahwa bentuk yang berarti dan bentuk logika mendasari terjemahan dalam tuturan apapun. Pada tingkatan ini, analisis berarti menentukan logika yang mengelola artikulasi dasar unit-unit terjemahan. Untuk melakukan hal ini, kita harus menggunakan formalisasi dan representasi hubungan di dalam dan antar kalimat.
Pemikiran dalam studi penerjemahan saat ini sepertinya terbatas pada dua paradoks yang saling berhubungan. Di satu sisi, pragmatisme “model interpretatif” yang jelas-jelas cenderung terlalu mengecilkan metode dan mengorbankan ketepatan demi komunikasi, dan akurasi demi kecepatan. Di sisi lain, pertentangan antara paradigma logika dan paradigma hermeneutika mengecilkan pengajaran penerjemahan menjadi semacam jembatan keledai (mnemonic) canggih tanpa dimensi meta-linguistik atau yang dapat diterapkan secara nyata.
Di bidang kala (tense) ini, teori terjemahan kita berkembang di antara kedua paradigma (kebutuhan akan penafsiran dan kebutuhan akan formalisasi). Ia mempertanyakan praktek interpretatif dalam proses penerjemahan. Faktanya, persoalan penafsiran saat ini sepertinya menjadi titik penghubung antara teori-teori teks dan teori-teori penerjemahan. Di dalam disiplin ilmu kita, saat ini persoalan ini menjadi unsur kontroversial utama di dalam menetapkan metodologi penerjemahan baru yang dapat diterapkan.
Kami menyarankan di bawah ini rancangan pendahuluan karya terjemahan yang dapat diminta dari penerjemah pemula.
1) Penyelarasan dan Kritik kumpulan teks yang diterjemahkan
Menyelaraskan kumpulan teks berarti mencocokkan setiap “unit terjemahan” korpus sumber ke unit padanan korpus target. Pada kasus ini, istilah “unit terjemahan” mencakup susunan panjang seperti bab atau paragraf serta susunan pendek seperti kalimat, frasa, atau cukup kata-kata.
Unit terjemahan yang dipilih tergantung pada sudut pandang yang dipilih untuk analisis linguistik dan pada jenis korpus yang digunakan sebagai database. Apabila korpus yang diterjemahkan benar-benar sesuai dengan aslinya, kita akan melanjutkan dengan penyelarasan dekat kedua kumpulan teks dengan kalimat atau bahkan kata, sebagai unit dasar, di mana apabila korpus yang digunakan merupakan adaptasi dan bukan penerjemahan harfiah, kita akan menyelaraskan unit yang lebih besar seperti paragraf atau bahkan bab.
Jelas bahwa dalil awal, yang membolehkan penggunaan kumpulan teks tersebut untuk pendidikan, adalah menetapkan kesesuaian antara isi unit-unit yang dikaji dan keterhubungannya. Apa yang disebut penerjemahan “bebas” harus menghasilkan pemikiran berdasar mengenai susunan yang hilang, perubahan urutan teks, modifikasi konten, adaptasi arti, dan sebagainya. Seluruh operasional ini sangat lazim dalam praktek penerjemahan sehari-hari namun frekuensinya bervariasi sesuai dengan bidang penelitian.
Selanjutnya, ada perbedaan struktural penting antara bahasa Inggris dan bahasa Arab yang menghalangi pemrosesan sekuensial yang teliti. Akibat perbedaan linguistik yang besar antara kedua sistem, kita seringkali melihat bahwa urutan kalimat telah diubah dan terkadang penghilangan atau penambahan terjadi antara kedua teks yang bagaimanapun juga merupakan terjemahan satu sama lain. Aspek-aspek ini harus dikaji dari sudut pandang stilistika dan, jika memungkinkan, disistematisasi.
Seluruh pengamatan ini menuntun kita untuk mempertimbangkan kumpulan teks paralel tidak seperti rangkaian susunan yang sepadan namun lebih sebagai database teks yang bersesuaian. Pada tingkat manapun (teks, paragraf, kalimat, frasa atau kata), korpus yang dikaji harus dianggap sebagai database leksikal dan terjemahan. Dengan kata lain, kami menyarankan untuk menyerahkannya ke teknik pencarian yang sama dengan yang digunakan dalam sistem pencarian informasi.
Karenanya, tujuan utamanya adalah menyoroti kesepadanan struktural antara kedua bahasa, dan, lebih pragmatis lagi, mencari unit T2 (teks target) terdekat ke “permintaan” yang diwakili oleh unit T1 (teks sumber).
2) Analisis Linguistik dan Stilistika Korpus
Tingkat analisis linguistik yang berbeda menjadi dasar untuk meneliti contoh-contoh terjemahan:
- Pertama, analisis morfologis mengidentikasi kata-kata atau morfem-morfem yang sepadan dalam korpus.
- Kedua, analisis sintaktis mengidentifikasi frasa-frasa dan struktur-struktur yang sesuai dalam kedua teks.
- Terakhir, analisis semantis mengidentifikasi arti unit dan ambiguitas pada akhirnya dalam setiap teks.

Kegunaan korpus semacam itu melampaui kerangka kerja penerjemahan yang terbatas. Meskipun tujuan utamanya adalah kritik penerjemahan, penggunaan lainnya yang berguna juga dapat dipertimbangkan seperti menghasilkan daftar terminologi dwi-bahasa, mengambil contoh untuk tujuan pengajaran, meningkatkan kamus-kamus yang ada saat ini atau bahkan untuk induksi aturan-aturan tata bahasa.
Pendekatan yang disarankan memungkinkan kita untuk mengoptimalkan pemikiran dalam penelitian penerjemahan tentang teks-teks dwibahasa. Ide umum pendekatan ini adalah menghubungkan “unit terjemahan” yang sepadan (kata, kalimat, struktur sintaktis) ketika susunan korpus diidentifikasi.
Sasaran utama pendekatan semacam itu adalah agar mekanisme pencocokan dapat dibagi ke dalam dua bagian yang berbeda:
1) Mengidentifikasi “unit-unit” yang berpotensi dapat dihubungkan dalam dua kumpulan teks.
2) Menghitung probabilitas unit-unit yang disarankan dengan memasukkannya ke data korpus dwibahasa.
Dengan membagi prosedur ke dalam dua fase, model penerjemahan yang relatif mudah dapat ditetapkan untuk mengidentifikasi unit-unit yang kemungkinan akan menghubungkan analisis teoritis dengan penerjemahan aktual yang diamati dalam korpus.
Salah satu cara yang mungkin untuk merancang sistem operasional adalah dengan mengembangkan metode analisis berdasarkan data yang disimpan dalam kumpulan teks pelatihan. Namun metode semacam itu, berdasarkan pelatihan model, tergantung pada jumlah informasi yang tersedia secara apriori.
Dalam hal ini, perbedaan dapat dibuat antara dua jenis situasi:
Situasi 1: Sebuah korpus paralel unit penerjemahan yang dianalisis dan dijelaskan tersedia secara apriori, yakni korpus di mana sebuah skema sintaktis mewakili struktur sebuah unit telah dipilih untuk masing-masing unit, dengan menimbang artinya. Situasi pertama ini, di mana jumlah informasi yang signifikan tersedia untuk mengevaluasi parameter model kesepadanan, akan dirujuk sebagai situasi pelatihan dan akan atau tidak akan digunakan, tergantung pada frekuensi kejadian di dalam korpus yang dijelaskan.
Situasi 2: Relatif sedikit informasi yang tersedia, yang artinya ini merupakan korpus yang mentah. Pada kasus ini, hipotesis harus dibuat berdasarkan estimasi ulang data korpus secara iteratif. Sebagai contoh, seluruh unit yang dimulai dengan rangkaian “kecuali itu” akan dikelompokkan untuk membandingkan terjemahannya.
Sangatlah menarik untuk mengetahui dalam hal ini bahwa salah satu keuntungan model statistik, dibanding dengan pendekatan linguistik kontrastif yang lebih teoritis, adalah hal itu banyak mengurangi jumlah kemungkinan penerjemahan kira-kira saat mengevaluasi kualitas kumpulan teks yang tersedia.
Karenanya, kajian kemungkinan penerjemahan yang tersedia dalam korpus kita berujung pada pengamatan tentang sifat kesepadanan berikut:
- kasus-kasus kesepadanan kuat di mana jumlah kata, urutannya dan artinya dalam kamus (dwibahasa) sama.
Contoh:
P1: “The rise in unemployment in March worries officials” (Kenaikan pengangguran pada bulan Maret mencemaskan para pejabat).
T1: “izdiyâd al-bitâla fî mâris yuqliq al-mas’ûlîn”
Secara harfiah: “(The) rise (in) the unemployment in March worries the officials” (Kenaikan penggangguran pada bulan Maret mencemaskan para pejabat).
- Kasus-kasus kemiripan kesepadanan di mana jumlah kata dan artinya sama namun urutannya berbeda.
Contoh:
P1: “The President of the Republic received his Syrian counterpart” (Presiden Republik menerima mitranya dari Suriah)
T1: “istaqbala ra’îs al-jumhûriyya nazîrahu al-sûrî”
Secara harfiah: “received (the) President of the Republic his counterpart Syrian. (menerima Presiden Republik mitranya dari Suriah)
- kasus-kasus kesepadanan yang lemah di mana urutan dan jumlah kata berbeda namun artinya dalam kamus sama.
Contoh:
P1: “Rains are expected in the North of the country”. (Hujan diharapkan (akan turun) di (kawasan) Utara negeri)
T1: “yutawaqqa‘u an tumtira fi al-shamâl”
Secara harfiah: “It is expected that it rains in the North” (Diharapkan akan turun hujan di (kawasan) Utara)
Dalam korpus dwibahasa kita, kasus terakhir ini merupakan mayoritas dalam kesepadanan penerjemahan. Penyelarasan menurun korpus dwibahasa digunakan untuk memastikan kehandalan yang paling mungkin untuk pengoperasian pencarian, mulai dari unit terjemahan terbesar (bab dan paragraf) hingga yang paling kecil (kalimat diikuti dengan frasa dan kata). Oleh karena itu, bidang analisis diperketat dengan melakukan penyelarasan “menyusut” unit-unit korpus dan dengan memfokuskan pencarian pada unit yang secara bertahap mengecil.

Kesimpulan
Dari sudut pandang metodologis, menggabungkan pendekatan linguistik dengan pendekatan stilistika memungkinkan kita untuk menyempurnakan penyelarasan dan meningkatkan kritik penerjemahan.
Namun demikian, beberapa aspek layak mendapat perhatian khusus untuk memastikan efisiensi pelatihan. Di satu sisi, jenis data yang digunakan, yakni teks paralel dwibahasa, dapat menimbulkan masalah jika kualitas korpus tidak bagus atau jika kualitas penerjemahan tidak dikendalikan dengan ketat.
Di sisi lain, ketajaman kritik dan ketepatan informasi yang disarikan terkait dengan penerjemahan tergantung pada volume data pelatihan yang tersedia.
Untuk semua alasan yang telah disebutkan di atas, terdapat kebutuhan akan periode pelatihan yang lama dengan jumlah data tekstual yang beragam. Begitu tahap ini telah diselesaikan, mekanisme yang diamati oleh peserta pelatihan pada korpus dapat diaktifkan kembali untuk menyimpulkan jenis solusi penerjemahan berbeda yang telah diuji.