Menguji Halusinasi pada LLM based App
Tujuan menuliskan artikel ini untuk membantu pengujian aplikasi berbasiskan AI yang bagi banyak software tester adalah merupakan hal yang baru.
Seperti halnya dalam pengujian konvensional, ketika menguji aplikasi berbasiskan AI sebagai software tester kita bisa menyiapkan test cases.
Pada artikel ini kita akan membahas test case untuk salah satu metric quality criteria yakni Halusinasi.
Mengapa LLM berhalusinasi?
Halusinasi terjadi ...
Testing LLM-Based Application using Opik and Deepeval
Tulisan ini terinspirasi dari pengalaman kami menguji Daily Friends yang merupakan produk flagship dari asah.ai yang digawangi dua orang mastah AI : Arridhana Ciptadi Ciptadi dan Ibrahim Arief. Cobain deh man teman, keren banget bikin kami yang ngetes terharu pas lagi curhat.
Dengan semakin berkembangnya teknologi AI dan pengaplikasiannya pada aplikasi perangkat lunak, maka kita sebagai praktisi ...
Uji Halusinasi menggunakan Embedding-Based Assertion
Disclaimer : Kami belum tahu apakah pendekatan ini akan cukup applicable untuk diterapkan sebagai praktek pengujian sehari-hari. Namun kami rasa ilmunya sangat baik untuk dipelajari untuk mengerti bagaimana model bekerja dan mengulik cara mengujinya.
Kemarin kita sudah membahas menguji halusinasi menggunakan teknik blackbox dan heuristic. Jika dijabarkan lebih jauh sebenarnya masih banyak heuristic yang bisa dipakai. Yang ...