McGill-NLP
/

gemma-2-9b-it-Injongo-intent

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

PeterYu commited on May 25, 2025

Commit

4650c36

·

verified ·

1 Parent(s): 826be5a

Update README.md

Files changed (1) hide show

README.md +84 -3

README.md CHANGED Viewed

@@ -1,3 +1,84 @@
----
-license: cc-by-4.0
----

+---
+license: cc-by-4.0
+datasets:
+- masakhane/InjongoIntent
+language:
+- en
+- am
+- ee
+- ha
+- ig
+- rw
+- ln
+- om
+- sn
+- sot
+- sw
+- tw
+- wo
+- xh
+- yo
+- zu
+- lg
+base_model:
+- google/gemma-2-9b-it
+library_name: transformers
+metrics:
+- accuracy
+---
+# INJONGO: A Multicultural Intent Detection and Slot-filling Dataset for 16 African Languages
+<!--
+## Evaluation Comparison
+ -->
+## Language Codes
+- **eng**: English
+- **amh**: Amharic
+- **ewe**: Ewe
+- **hau**: Hausa
+- **ibo**: Igbo
+- **kin**: Kinyarwanda
+- **lin**: Lingala
+- **lug**: Luganda
+- **orm**: Oromo
+- **sna**: Shona
+- **sot**: Sesotho
+- **swa**: Swahili
+- **twi**: Twi
+- **wol**: Wolof
+- **xho**: Xhosa
+- **yor**: Yoruba
+- **zul**: Zulu
+## Notes
+- **Bold** values indicate the best performing scores in each category
+- The highlighted models (AfroXLMR 76L) show the top overall performance
+- Multi-lingual training generally outperforms in-language training
+- Standard deviations are reported alongside average scores
+- AVG doest not include english results.
+### Citation
+```
+@misc{yu2025injongo,
+      title={INJONGO: A Multicultural Intent Detection and Slot-filling Dataset for 16 African Languages},
+      author={Hao Yu and Jesujoba O. Alabi and Andiswa Bukula and Jian Yun Zhuang and En-Shiun Annie Lee and Tadesse Kebede Guge and Israel Abebe Azime and Happy Buzaaba and Blessing Kudzaishe Sibanda and Godson K. Kalipe and Jonathan Mukiibi and Salomon Kabongo Kabenamualu and Mmasibidi Setaka and Lolwethu Ndolela and Nkiruka Odu and Rooweither Mabuya and Shamsuddeen Hassan Muhammad and Salomey Osei and Sokhar Samb and Juliet W. Murage and Dietrich Klakow and David Ifeoluwa Adelani},
+      year={2025},
+      eprint={2502.09814},
+      archivePrefix={arXiv},
+      primaryClass={cs.CL},
+      url={https://arxiv.org/abs/2502.09814},
+}
+```
+```
+@misc{adelani2023sib200,
+      title={SIB-200: A Simple, Inclusive, and Big Evaluation Dataset for Topic Classification in 200+ Languages and Dialects},
+      author={David Ifeoluwa Adelani and Hannah Liu and Xiaoyu Shen and Nikita Vassilyev and Jesujoba O. Alabi and Yanke Mao and Haonan Gao and Annie En-Shiun Lee},
+      year={2023},
+      eprint={2309.07445},
+      archivePrefix={arXiv},
+      primaryClass={cs.CL}
+}
+```