Xiaomi menduduki peringkat teratas di dunia dalam penalaran audio AI

Xiaomi telah mencapai terobosan dalam kecerdasan buatan, dan tim Big Model-nya berada di garis depan dalam teknologi penalaran audio. Dalam sebuah prestasi luar biasa yang menunjukkan kehebatan perusahaan yang terus berkembang dalam penelitian AI terdepan, model terbaru Xiaomi telah melampaui raksasa industri seperti OpenAI dan Google dalam tolok ukur pemahaman audio.

Tim mengumumkan melalui akun resmi Xiaomi Technology bahwa mereka telah menduduki posisi teratas dalam daftar penilaian MMAU (Massive Multi-Task Audio Understanding and Reasoning) yang terkenal di dunia. Model mereka mencapai rekor akurasi 64,5% – secara signifikan mengungguli GPT-4o dari OpenAI (57,3%) dan Gemini 2.0 Flash dari Google (55,6%).

Pendekatan Pembelajaran Penguatan Revolusioner

Yang sangat penting dari pencapaian ini adalah kecepatan pencapaiannya. Mengikuti jejak DeepSeek-R1, para peneliti di Xiaomi memperluas algoritme pembelajaran penguatan ke tugas pemahaman audio multimodal dan merealisasikannya dalam jangka waktu satu minggu.

Para ilmuwan menerapkan metode Group Relative Policy Optimization (GRPO) yang memungkinkan model AI untuk belajar secara mandiri melalui mekanisme “trial and error-reward”. Mekanisme ini memungkinkan terciptanya kemampuan penalaran yang mirip dengan refleksi manusia dan verifikasi multi-langkah.

Zhang Wei, kepala peneliti dalam proyek ini, menambahkan: “Pembelajaran dengan penguatan sangat baik dalam menangani kesenjangan yang besar antara pembuatan dan pengecekan hasil. Penalaran audio adalah tugas yang tepat untuk hal tersebut, di mana pemikiran aktif menciptakan hasil yang lebih efisien daripada menghafal pola.”

Lebih dari Sekadar Mengenali Suara

Aplikasi AI saat ini membutuhkan lebih dari sekadar pengenalan suara. Terobosan Xiaomi memungkinkan AI untuk melakukannya:

  • Menentukan potensi kerusakan pada kendaraan dengan menganalisis rekaman kokpit
  • Menyimpulkan suasana hati seorang komposer dengan mendengarkan pertunjukan musik
  • Mengantisipasi risiko tabrakan di tempat-tempat ramai seperti stasiun kereta bawah tanah

Perangkat uji MMAU menggunakan 10.000 klip audio mulai dari ucapan, suara sekitar, hingga musik dengan pasangan pertanyaan-jawaban beranotasi manusia untuk menguji model pada 27 keterampilan.

Mengganggu Pendekatan AI Tradisional

Eksperimen Xiaomi menghasilkan beberapa temuan mengejutkan yang menantang kebijaksanaan pengembangan AI konvensional:

  • Pembelajaran dengan penguatan secara signifikan mengungguli pembelajaran yang diawasi pada kumpulan data yang hanya terdiri dari 38.000 item
  • Model 7B-parameter mereka menunjukkan kemampuan penalaran yang unggul meskipun jauh lebih kecil daripada model pesaing lainnya yang memiliki 100B+ parameter
  • Memaksa model untuk menghasilkan proses penalaran eksplisit ternyata mengurangi kinerja sebesar 3,4%.

Meskipun akurasi 64,5% tergolong tinggi, angka ini masih lebih rendah daripada tolok ukur 82,23% dari para ahli manusia, yang mengindikasikan bahwa masih banyak ruang untuk perbaikan.

Komitmen Sumber Terbuka

Sesuai dengan filosofi Xiaomi tentang inovasi untuk semua orang, organisasi ini telah membuat sumber terbuka untuk kode pelatihan dan parameter model. Dengan tindakan altruistik ini, perusahaan ini memungkinkan para pengembang dan peneliti di seluruh dunia untuk mengembangkan inovasinya.

“Dengan membuka upaya kami kepada komunitas AI global, kami bertujuan untuk mempercepat proses menuju pemahaman audio cerdas yang sesungguhnya,” kata pendiri dan CEO Xiaomi, Lei Jun. “Ini adalah langkah lebih lanjut dalam misi kami untuk membuat teknologi inovatif dapat diakses oleh semua orang.”

Bagi mereka yang tertarik untuk bereksperimen dengan teknologi ini:

Terobosan ini muncul ketika Xiaomi memperkenalkan fitur AI di seluruh jajaran produknya, mulai dari ponsel pintar hingga produk rumah pintar IoT, dan membuat perusahaan ini menjadi pesaing serius dalam arena penelitian AI global.

Sumber: IT Home

Play Store icon
HyperOS Downloader Easily check if your phone is eligible for HyperOS 2.0 update!
Download icon

Tinggalkan Balasan

Polling
Which name did you like better, MIUI or HyperOS?