Datalingvistik: Forskelle mellem versioner

Content deleted Content added
m Link til korpora/ tekstkorpus
Linje 3:
En af datalingvistikkens hovedformål har traditionelt været at opstille [[formel grammatik|formelle grammatikker]] for forskellige aspekter af sproget, dvs. regelsæt der definerer fx den uendelige mængde af et sprogs grammatisk korrekte sætninger uden at overgeneralisere til ugrammatiske sætninger. Tilsvarende regel-baserede modeller har været tilstræbt for diverse andre [[Lingvistik|sprogstrukturelle]] fænomener.
 
De mange undtagelser der altid findes til formelle regler man kan stille op for sproglige fænomener har imidlertid ført til en dalende interesse for formelle grammatikker til fordel for undersøgelser af faktiske forekommende sproglige mønstre i store tekstsamlinger (kaldet [[KorpusTekstkorpus|korpora]]). Datalingvistikken har dermed taget en drejning hen imod ''datadreven'' eller ''statistisk'' natursprogsbehandling og [[korpuslingvistik]].