1. Verkefnið snýst um að gefa út villumálheild sem samanstendur af textum á íslensku.
• Í verkefninu er textum safnað saman og þeir gefnir út með CC-BY 4.0 leyfi samkvæmt samþykki höfunda þeirra. (Sjá https://github.com/antonkarl/iceErrorCorpus/blob/master/cc-by-4-0.txt.)
• Safnið verður gefið út á evrópska málfangasafninu CLARIN, https://clarin.is/.
• Textarnir geta verið fjölbreytilegir en verða líklega að miklu leyti námsritgerðir, bæði styttri verkefni, lengri ritgerðir og jafnvel lokaritgerðir.
• Í verkefninu verða ritvillur merktar og þær upplýsingar gefnar út með textunum. Þetta er gert til að hægt sé að rannsaka m.a. tíðni á tegundum villna, einkum til að hægt sé að þróa betra námsefni og kennsluaðferðir og til að þróa leiðréttingarforrit sem veitir sjálfvirka málfarsráðgjöf.