Sumut

Deep Think dan Gemini 2.5 Pro! AI Google Kini Bisa Berpikir Lebih Dalam

Kurnia | 21 Mei 2025, 03:01 WIB
Deep Think dan Gemini 2.5 Pro! AI Google Kini Bisa Berpikir Lebih Dalam

AKURAT SUMUT - Google semakin mendekatkan diri pada visi asisten AI universal yang mampu memahami konteks, merencanakan, dan bertindak secara mandiri.

Pada perhelatan Google I/O, perusahaan mengumumkan berbagai peningkatan pada model Gemini 2.5 Flash dan 2.5 Pro, termasuk fitur eksperimental ‘Deep Think’ yang menandai lompatan baru dalam kemampuan berpikir mendalam.

Peningkatan Gemini 2.5 Pro: ‘Deep Think’ untuk Hipotesis Paralel Gemini 2.5 Pro, yang diperkenalkan pertama kali pada Maret lalu dengan jendela konteks berkapasitas satu juta token, kini dilengkapi mode berpikir lanjutan bernama Deep Think.

Demis Hassabis, CEO Google DeepMind, menjelaskan, “Kami mengadopsi pelajaran dari AlphaGo, bahwa respons AI meningkat saat diberi waktu lebih untuk berpikir.”

Deep Think memungkinkan model memproses berbagai hipotesis secara paralel sebelum menghasilkan jawaban.

Sejak diuji di beberapa tolok ukur paling menantang, Deep Think mencatatkan prestasi gemilang, memimpin pada soal-soal sulit Olimpiade Matematika AS (USAMO), unggul di LiveCodeBench untuk pemrograman kompetisi, dan meraih 84,0% pada MMMU, yang menilai kemampuan multimodal dan penalaran.

Sementara itu, Gemini 2.5 Flash, model andalan untuk kecepatan, efisiensi, dan biaya rendah juga mendapatkan peningkatan menyeluruh dalam penalaran, multimodalitas, pemrograman, dan pemrosesan konteks panjang.

Baca Juga: Acer Tampil Beda di Computex 2025, Luncurkan Smart Ring dan Earbud AI

Menurut Hassabis, Flash kini hanya tertinggal sedikit di belakang Pro dalam peringkat LMArena.

Lebih hemat token hingga 20–30%, Flash kini tersedia untuk pratinjau di Google AI Studio, Vertex AI, dan aplikasi Gemini. Google menjadwalkan peluncuran umum untuk penggunaan produksi pada awal Juni.

Fitur Suara dan Multibahasa Kedua model kini mendukung keluaran audio native untuk menciptakan pengalaman percakapan yang lebih alami, serta text-to-speech yang mendukung lebih dari 24 bahasa dengan kemampuan beralih dialek secara instan.

Koray Kavukcuoglu, CTO Google DeepMind, dan Tulsee Doshi, Senior Director Product Management, menuliskan, “Text-to-speech yang ekspresif dapat menangkap nuansa halus, seperti bisikan.”

Fitur suara eksperimental lainnya mencakup dialog afektif untuk mendeteksi emosi pengguna, audio proaktif yang menyaring kebisingan latar, dan kemampuan berpikir langsung melalui Live API untuk tugas kompleks.

Ringkasan Pemikiran dan Anggaran Berpikir Untuk mendukung transparansi, Gemini 2.5 Pro dan Flash kini menyertakan thought summaries, ringkasan pemikiran model dengan format terstruktur, lengkap dengan header, detail kunci, dan informasi penggunaan alat.

Selain itu, ‘thinking budgets’ memberi pengembang kendali atas jumlah token yang dipakai model untuk berpikir, atau menonaktifkan proses berpikir hingga respons langsung.

Fitur ini akan tersedia secara umum dalam beberapa minggu mendatang.

Integrasi dan Protokol Terbuka Google juga menambahkan dukungan SDK untuk Model Context Protocol (MCP) dalam Gemini API, memudahkan integrasi dengan berbagai alat open-source.

Demis Hassabis menutup pengumuman ini dengan refleksi optimis, “Kita sedang menyaksikan momen bersejarah di mana AI membuka kemungkinan masa depan yang luar biasa. Kemajuan ini tidak akan berhenti.”

Bagikan:
  • Share to WhatsApp
  • Share to X (Twitter)
  • Share to Facebook

Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi.

K
Reporter
Kurnia
I