Selamat datang di Arsip Kalamang. Untuk Bahasa Indonesia, tekan ini.
Contents
This collection encompasses the Kalamang language and life on Karas in eastern Indonesia.
Kalamang (kgv, kara1499) is a Papuan language of the West Bomberai family. It is spoken in eastern Indonesia, in West Papua province, on an island just off the coast of Bomberai peninsula. The island belongs to a group of three referred to as the Karas Islands. Kalamang is spoken on the biggest of the islands, in both of the villages on the island: Antalisa (Tamisen in Kalamang) and Mas (Sewa). The Austronesian language Uruangnirin is spoken on the two smaller Karas Islands. In older literature, Kalamang is known as Karas. The language is currently estimated to have some 190 speakers, not all of whom can be considered fluent.
The largest part of this corpus is linguistic material, including video-recorded conversations and narratives, elicited words and sentences, a lexicon, and recordings of people interacting with different stimulus materials like picture books or short video clips. In addition, this corpus contains a modest number of pictures and videos of plants and a description of how they are used, and videos and pictures of cultural events like marriages.
The linguistic material was contributed by more than 30 speakers of Kalamang, and gathered and processed by Eline Visser in 2015-2021 as part of an MA and PhD in linguistics.
Video recordings: 151
Audio recordings: 223
Annotations: 104
Pictures: 389
Hours of transcribed material: 15,5
Amount of transcribed words: 70000 (excluding elicited sentences)
This corpus was created by Eline Visser, starting in 2015 for an MA thesis on the phonology of Kalamang, and continuing in 2017-2021 as part of a PhD in linguistics.
Three Kalamang speakers have been vital in helping with the transcription and translation of the linguistic material, and placing things in their cultural context. These are Kamarudin Gusek, Fajaria Yarkuran and Hair Yorkuran.

The following speakers contributed with recordings to this corpus: Abdul Malik Baraweri, Kamarudin Gusek, Bini Rumatiga, Mujid Rumatiga, Abdul Yarkuran, Abu Wambur, Amir Yarkuran, Arfan Yarkuran, Fajaria Yarkuran, Hapsa Yarkuran, Jusman Yarkuran, Kabasia Yarkuran, Kamalia Yarkuran, Malik Yarkuran, Nurmia Yarkuran, Rahma Yarkuran, Sabtu Yarkuran, Salim Yarkuran, Samsia Yarkuran, Sebi Yarkuran, Amran Yorkuran, Hair Yorkuran, Jubair Yorkuran, Maimuna Yorkuran, Hawa Yorre, Jaleha Yorre and Naimun Yorre. Metadata for each speaker can be found in the recordings or questionnaires they contributed to.



Pictures for the dictionary were contributed by Burhan Retob, Abdulkadir Yarkuran, Tami Dewi Yarkuran, Dahrin Yorre, Mira Yorre, and Eline Visser.
In consultation with the Kalamang community, it was decided that all resources should be open access. No material, however, is to be used for commercial purposes or for profit.
This corpus is built around a tree structure, but contains enough metadata to facilitate custom searches. (For a manual of the archive structure viewer, click ‘manual’ in the top right or see https://www.mpi.nl/corpus/html/asv/index.html). Most recordings contain metadata on the speakers, the file type, the location, a short and longer description, the genre, the languages, and a corpus tag. The latter is a tag used in the grammar of Kalamang to refer to recordings in the corpus.
The tree structure has the following main nodes:
All archived materials have a date. If the precise date was unknown, it is set to the first of January of the year of collection.
The core of this corpus are the 104 transcribed recordings. Most of these are video recordings. They can be roughly divided into three genres:
A different and finer division can be made as follows, based on categories available in the transcription software FieldWorks:
Both divisions can be found in the metadata of the recordings, so that one can search for all these genres.
Each bundle with transcribed recordings minimally contains an audio or video file and an .eaf file with the transcription. Further files typically have the same name with a suffix: _a or _aud is usually an audio extract from the original video. In some cases it is an audio backup recorded with a separate audio recorder. Files with a suffix _c or _comp are comprimed video files. These can be used by people with slower internet connections instead of the original video files.
In the transcriptions, interrupted speech is indicated with a dash connected to the interrupted word, e.g. komangun ta- kon. Inaudible passages are transcribed as (...) or (inaudible). When an educated guess could be made about a transcription, it is placed between brackets, e.g. (wangga). All transcribed texts contain a morpheme-by-morpheme analysis including glosses and part of speech, a Papuan Malay and an English translation, as well as notes on culture and linguistic analysis. The transcription lacks detail in the following areas: length, filled pauses, some interjections or ideophones, phonetics, prosody, gesture.
This corpus contains a lot of elicited data as well. Most of it is filed under Elicited language. Other elicited data can be found in the notebooks. Elicited data with help of questionnaires is digitalised as transcribed FieldWorks files (in xml format). Please use this data cautiously. Always check the original field notes and questionnaires for details, and always check the Kalamang grammar first for a holistic analysis of the data! The field notes and original questionnaires often contain more examples, notes on grammaticality, show whether elicitation was done by translating from Papuan Malay or monolingually, etc. The FieldWorks files only make parts of these notes searchable.
Kalamang is a ‘definitely endangered’ language according to UNESCO’s language vitality and endangerment framework. In 2019, a speaker count revealed that Kalamang has less than 190 speakers left, not all of whom can be considered fluent speakers (see the Kalamang grammar and speaker count raw data). There are no fluent speakers of Kalamang born after 1990. I estimate that around half the population of both Antalisa and Mas do not speak Kalamang. These are, apart from the people born after 1990, the wives and husbands of Kalamang speakers who come from other regions in Indonesia. These people typically know a few words and phrases, but cannot have a conversation in Kalamang.
All Kalamang speakers are bilingual in Papuan Malay, and some also in Bahasa Indonesia (the former is a cover term for the regional variants of Malay used in Papua, the latter a standardised version of Malay that is the national language of Indonesia). Papuan Malay is used in those instances where a non-Kalamang speaker joins the conversation. Naturally, these situations include village gatherings or speeches at a wedding, but Kalamang is by no means avoided at these instances for conversations in smaller groups or for the performance of rituals.
Kalamang has no written tradition, and is not used as an administrative language. When asked, people readily write Kalamang words and texts without problems, using Indonesian orthography, which fits Kalamang phonology well. In the past three years, with the spread of smartphones and internet connections, some Kalamang may be found on for example Facebook. But as it is mainly non-fluent and passive speakers that are connected, the use of written Kalamang seems limited to short phrases alternated with Papuan Malay.
Kalamang is part of the West Bomberai family, together with Mbaham (bdw, baha 1258) and Iha (iph, ihaa1241), which are more similar to each other than to Kalamang. Links between the West Bomberai and Timor-Alor-Pantar families are currently under investigation (Schapper, p.c.).
Kalamang is spoken in an area with a mix of Austronesian and non-Austronesian (Papuan) languages, as can be seen on the following map.

Kalamang is spoken on the biggest of the two Karas Islands, which sports just two villages, Mas and Antalisa, and a large number of white sand beaches with a patch of cleared land used for the cultivation of coconuts, nutmegs, and kitchen gardens. Except for these villages, beaches and patches of cleared land, all mainland is forest-covered limestone mountain. The Karas Islands are surrounded by reefs and sea, which are used for fishing and diving.

The Karas Islands can be reached in four hours by longboat from the regency capital Fakfak, which has a harbour with a Pelni (Indonesian National Shipping) stop and a small airport.
The inhabitants of Mas and Antalisa are muslims, observing a mixture of local and Islamic traditions, some of which can be found here. Transcribed recordings of descriptions of cultural events, many of them with additional picture material, include:
Search also for the keywords ‘ritual’, ‘custom’, ‘adat’ and ‘tradition’.
The corpus also contains several traditional narratives (search for ‘tale’ or ‘myth’), recordings of descriptions of and prescriptions for traditional medicines (search for ‘traditional medicine’, pictures here), handicrafts (search for ‘procedural’ or ‘handicraft’), houses and canoes (search for ‘procedural’ and/or ‘construction’). See also the pictures here and here).
Kalamang speakers refer to themselves as Kalamang.
This corpus contains the following language materials that were published separately:
This corpus contains the raw data for the following scholarly materials published to date:
As a side project, some linguistic material on the Austronesian languages Uruangnirin (urn, urua1244) and Geser-Gorom (ges, gese1240) was collected during the Kalamang project. This is archived in the following places:
To refer to any data from the corpus, please cite the corpus in this way:
Visser, Eline. 2021. The Kalamang collection: an archive of linguistic and cultural material from Karas. Lund: Humlab, Lund University Humanities Lab. http://hdl.handle.net/10050/00-0000-0000-0003-C3E8-1@view. Accessed on [insert date here].
BibTeX:
@misc{visser2021kalamangcorpus,
author = {Visser, Eline},
title = {The {K}alamang collection: an archive of linguistic and cultural material from {K}aras},
year = {2020},
collector = {Eline Visser},
howpublished = {Lund: Humlab, Lund University Humanities Lab},
url = {http://hdl.handle.net/10050/00-0000-0000-0003-C3E8-1@view}
}
Terjemahan: Dita Anissa Johar
Selamat datang di Arsip Kalamang. Untuk Bahasa Inggris, tekan ini.
Daftar isi
Koleksi ini mencakup Bahasa Kalamang dan kehidupan di Karas, Kabupaten Fakfak, Papua Barat.
Kalamang (kgv, kara1499), adalah salah satu Bahasa Papua yang berasal dari suku Bomberai Barat. Bahasa ini digunakan di Indonesia bagian timur, di propinsi Papua Barat, di sebuah pulau di lepas pantai semenanjung Bomberai. Pulau ini salah satu dari tiga pulau yang dikenal sebagai kepulauan Karas. Bahasa Kalamang digunakan di pulau terbesar di kepulauan tersebut, di kedua desa yang terdapat di palau tersebut: Antalisa (Tamisen dalam bahasa Kalamang) dan Mas (Sewa). Bahasa Austronesia Uruangnirin digunakan di dua pulau yang lebih kecul di kepulauan Karas. Dalam kesusastraan kuno, Kalaman dikenal sebagai Karas. Bahasa tersebut saat ini diperkirakan memiliki sekitar 190 penutur, dimana tidak semua penutur dapat dianggap fasih.
Bagian terbesar dari korpus ini adalah materi mengenai linguistik, termasuk video rekaman percakapan dan narasi, kata dan kalimat yang timbul dari bahasa, leksikon, dan rekaman interaksi manusia dengan berbagai macam materi stimulus seperti buku bergambar dan potongan video pendek. Selain itu, korpus ini juga berisi sejumlah foto dan video tumbuhan dan deskripsi mengenai bagaimana mereka digunakan, juga foto dan video acara kebudayaan seperti pernikahan.
Materi linguistik dala korpus ini dikontribusikan oleh lebih dari 30 penutur Bahasa Kalamang dan dikumpulkan dan diolah oleh Eline Visser pada tahun 2015-2021 sebagai bagian dari MA dan PhD di bidang Linguistik.
Rekaman video: 151
Rekaman suara: 223
Anotasi: 104
Foto: 389
Jumlah waktu materi yang ditranskrip: 15,5
Jumlah kata materi yang ditranskrip: 70000 (excluding elicited sentences)
Korpus ini dibuat oleh Eline Visser, dimulai pada tahun 2015 untuk thesis MA mengenai fonologi bahas Kalamang dan diteruskan pada tahun 2017 – 2021 sebagai bagian dari PhD dalam bidang lingusitik.
Tiga penutur bahasa Kalamang menjadi bagian vital dalam membantu mentranskripsi dan menerjemahkan materi linguistik dan memastikan ketepatan konteks budaya dalam materi tersebut. Mereka adalah Kamarudin Gusek, Fajaria Yarkuran dan Hair Yorkuran.

Para penutur berikut berkontribusi dalam korpus ini dengan bahan rekaman: Abdul Malik Baraweri, Kamarudin Gusek, Bini Rumatiga, Mujid Rumatiga, Abdul Yarkuran, Abu Wambur, Amir Yarkuran, Arfan Yarkuran, Fajaria Yarkuran, Hapsa Yarkuran, Jusman Yarkuran, Kabasia Yarkuran, Kamalia Yarkuran, Malik Yarkuran, Nurmia Yarkuran, Rahma Yarkuran, Sabtu Yarkuran, Salim Yarkuran, Samsia Yarkuran, Sebi Yarkuran, Amran Yorkuran, Hair Yorkuran, Jubair Yorkuran, Maimuna Yorkuran, Hawa Yorre, Jaleha Yorre and Naimun Yorre.



Foto untuk kamus adalah hasil kontribusi dari Burhan Retob, Abdulkadir Yarkuran, Tami Dewi Yarkuran, Dahrin Yorre, Mira Yorre, and Eline Visser.
Dalam konsultasi dengan komunitas Kalamang diputuskan bahwa seluruh sumber daya akan dalam bentuk akses terbuka. Tidak ada materi yang digunakan untuk kebutuhan komersil atau untuk mencari keuntungan.
Korpus ini dibuat dalam bentuk struktur pohon, tetapi mengandung cukup banyak metadata untuk memfasilitasi pencarian kustom. (Untuk panduan penampil struktur arsip tekan 'manual' di kanan atas atau lihat https://www.mpi.nl/corpus/html/asv/index.html). Sebagian besar rekaman berisi metadata tentang pembicara, jenis file, lokasi, deskripsi singkat dan panjang, genre, bahasa, dan tag korpus. Tag korpus ada tag yang digunakan dalam tata bahasa Kalamang untuk merujuk pada rekaman dalam korpus.
Struktur Pohon memiliki simpul utama sebagai berikut:
Semua materi yang diarsipkan telah diberi tanggal. Jika tanggal yang pasti tidak diketahui, maka dituliskan tanggal satu Januari di tahun pengambilan data dilakukan.
Inti dari korpus ini adalah 104 rekaman yang telah ditranskripsikan. Sebagian besar adalah rekaman video. Secara kasar, mereka dapat dibagi menjadi tiga genre:
Pembagian yang berbeda dan lebih terperinci dapat dilakukan sebagai berikut, berdasarkan kategori yang tersedia dalam perangkat lunak trenskripsi FieldWorks:
Setiap bundel dengan rekaman yang ditranskripsi setidaknya berisi satu file audio atau video dan satu file .eaf dengan hasil transkripsi. File lain pada umumnya diberi nama yang sama dengan akhiran: _a atau _aud biasa merupakan ekstrak audio dari video asli. Pada beberapa kasus, ini adalah cadangan file audio yang direkam secara terpisah menggunakan alat perekam yang berbeda. File dengan nama yang diberi akhiran _c atau _comp merupakan file video yang telah dikompresi. Video ini dapat digunakan oleh mereka yang memiliki koneksi internet yang lebih lambat daripada menggunakan file asli video tersebut.
Dalam transkripsi, ucapan yang terputus di tunjukkan dengan tanda hubung yang dihubungkan dengan kata yang terputus, contoh: komangun ta- kon. Bagian yang tidak terdengar di transkripskan sebgai (...) atau (inaudible). Ketika perkiraan tentang sebuah transkripsi dapat dilakukan, maka perkiraan tersebut dituliskan dalam tanda kurung, contoh: (wangga). Semua teks hasil transkripsi mengandung analisis morfem demi morfem termasuk keterangan dan bagian dari kalimat, terjemahan dalam bahasa Papua Melayu dan Inggris, serta catatan mengenai analisis kebudayaan dan linguistik. Hasil transkripsi kurang detail dalam hal berikut: durasi, jeda penuh, beberapa kata seru atau ideofon, fonetik, prosodi, dan bahasa tubuh.
Korpus ini berisi berbagai data yang diperoleh. Sebagian besar disimpan di Elicited language. Data yang diperoleh lainnya dapat ditemukan dalam buku catatan (notebooks). Data yang diperoleh dengan bantuan kuisioner di digitalkan menjadi file transkripsi FieldWorks (dalam format xml). Harap gunakan data ini dengan hati- hati. Selalu periksa kembali catatan lapangan dan kuisioner asli untuk detailnya, dan selalu periksa Tata bahasa Kalamang (Kalamang grammar) terlebih dahulu untuk analisis data yang lebih holistik! Catatan lapangan dan kuisioner asli sering kali mengandung lebih banyak contoh, catatan mengenai tata bahasa, menunjukkan bagaimana pemerolehan data dilakukan, apakah melalui terjemahan dari Papua Melayu atau satu bahasa, dsb. File FieldWorks hanya membuat sebagian dari catatan tersebut dapat dicari.
Bahasa Kalamang merupakan bahasa yang ‘definitely endangered’ (pasti terancam punah) menurut framework vitalitas keterancaman milik UNESCO. Pada tahun 2019, penghitungan penutur bahasa menunjukkan bahwa bahasa Kalamang memiliki kurang dari 190 penutur, dimana tidak semua diantaranya dikategorikan sebagai penutur fasih (lihat Kalamang grammar dan speaker count raw data). Tidak ada penutur fasih bahasa Kalamang yang terlahir setelah tahun 1990. Saya memperkirakan bahwa setengah dari poulasi Antalisa dan Mas tidak menggunakan bahasa Kalamang. Selain populasi yang terlahir setelah tahun 1990, mereka adalah istri dan suami para penutur bahasa Kalamang yang berasal dari daerah- daerah lain di Indonesia. Mereka pada umumnya tahu beberapa kata dan frasa tetapi tidak bisa melakukan percakapan dalam bahasa Kalamang.
Semua penutur bahasa Kalamang merupakan dwibahasa dalam Melayu Papua dan beberapa juga berbahasa Bahasa Indonesia (yang pertama adalah istilah yang digunakan untuk varian regional bahasa melayu yang digunakan di Papua, yang kedua adalah versi bahasa Melayu yang telah di standardisasi yang merupakan bahasa nasional Indonesia). Bahasa Melayu Papua digunakan pada saat orang yang bukan penutur Kalamang bergabung dalam sebuah percakapan. Pada umumnya, situasi ini terjadi pada pertemuan desa atau pembacaan pidato di pernikahan, tetapi bahasa Kalamang sama sekali tidak dihindari pada situasi- situasi ini, melainkan digunakan dalam percakapan kelompok kecil atau pertunjukan ritual.
Bahasa Kalamang tidak memiliki tradisi tertulis dan tidak digunakan sebagai bahasa administrasi. Ketika diminta, penutur dengan sigap menulis kata dan teks dalam bahas Kalamang tanpa masalah, menggunakan ortografi bahasa Indonesia, yang cocok dengan fonologi bahasa Kalamang. Dalam kurun waktu tiga tahun terakhir, dengan peredaran smartphone dan koneksi internet yang luas, sebagian bahasa Kalamang dapat dijumpai, contohnya di Facebook. Tetapi, karena mayoritas yang terhubung adalah penutur tidak fasih dan pengguna pasif, penggunaan bahasa Kalamang tertulis tampaknya terbatas pada frasa- frasa pendek yang digunakan bergantian dengan bahasa Melayu Papua.
Kalamang merupakan bagian dari suku Bomberai Barat, bersama dengan Mbaham (bdw, baha 1258) dan Iha (iph, ihaal 1241), yang lebih mirip satu sama lain dibandingkan dengan Kalamang. Hubungan antara suku Bomberai Barat dan Timor- Alor- Pantar saat ini sedang dalam penelitian (Schapper, p.c.).
Bahasa Kalamang digunakan di daerah dengan percampuran bahasa Austronesia dan non-Austronesia (Papua), seperti yang dapat dilihat pada peta berikut.

Bahasa Kalamang digunakan di pulau terbesar dari dua pulau yang membentuk kepulauan Karas, yang hanya diduduki dua desa, Mas dan Antalisa, dan sejumlah besar pantai berpasir putih dengan sepetak tanah kosong yang digunakan untuk budidaya kelapa, pala, dan sayuran. Selain kedua desa, pantai dan petak tanah kosong tersebut, semua daratan merupakan pegunungan kapur yang tertutup hutan. Kepulauan Karas dikelilingi karang dan lautan, yang digunakan untuk memancing dan menyelam.

Kepulauan Karas dapat dijangkau dalam empat jam dengan perahu dari ibu kota kabupaten FakFak, yang memiliki pelabuhan dengan pemberhentian Pelni (Pelayaran Nasional Indonesia) dan sebuah bandar udara kecil.
Penduduk mas dan Antalika beragama Islam, dengan mengamati percampuran antara tradisi lokal dan Islam, beberapa diantaranya dapat ditemukan di sini. Rekaman yang telah ditranskripsi mengenai acara- acara kebudayaan, sebagian besar dengan tambahan materi berupa gambar, termasuk:
Lihat juga kata kunci ‘ritual’, ‘custom’, ‘adat’ dan ‘tradition’.
Korpus ini juga berisi beberapa narasi tradisional (cari ‘tale’ atau ‘myth’), rekaman deskripsi dan preskripsi obat- obatan tradisional (cari ‘traditional medicine’, gambar ada di sini), kerajinan tangan (cari ‘procedural’ atau ‘handicraft’), rumah dan kano (cari ‘procedural’ adan/atau ‘construction’). Lihat juga gambar-gambar yang terdapat di sini dan sini).
Penutur Kalamang menyebut diri mereka sendiri sebagai Kalamang.
Korpus ini berisi materi bahasa yang diterbitkan secara terpisah sebagai berikut:
Korpus ini berisi data mentah untuk materi ilmiah berikut yang telah diterbitkan hingga saat ini:
Sebagai proyek sampingan, beberapa materi linguistik mengenai bahasa Austronesia Uruangnirin (urn, urual1244) dan Geser-Gorom (ges, gese1240) dikumpulkan selama proyek Kalamang. Materi ini diarsipkan di alamat berikut:
Dalam mereferensi data apapun dari korpus ini, harap mengutip korpus ini sebaga berikut:
Visser, Eline. 2021. The Kalamang collection: an archive of linguistic and cultural material from Karas. Lund: Humlab, Lund University Humanities Lab. http://hdl.handle.net/10050/00-0000-0000-0003-C3E8-1@view. Accessed on [insert date here].
BibTeX:
@misc{visser2021kalamangcorpus,
author = {Visser, Eline},
title = {The {K}alamang collection: an archive of linguistic and cultural material from {K}aras},
year = {2020},
collector = {Eline Visser},
howpublished = {Lund: Humlab, Lund University Humanities Lab},
url = {http://hdl.handle.net/10050/00-0000-0000-0003-C3E8-1@view}
}