L’Institut Langage et Communication fonde une grande part de ses recherches sur des corpus linguistiques et médiatiques d’ampleur, d’origine et de support variables.
La rigueur dans la conception et le recueil des données (et métadonnées) de ces corpus servent à la résolution de questions de recherche pointues.
Par ailleurs, la poursuite constante d’améliorations dans l’édition (transcription, nettoyage, anonymisation…) et dans l’annotation des corpus est en soi un objet de recherche que l'ILC valorise aux seins de réseaux internationaux.