Presentació
El Corpus Informatitzat del Valencià (CIVAL) és un projecte de l’Acadèmia Valenciana de la Llengua (AVL) que pretén oferir als usuaris documentació fidedigna de l’ús del valencià al llarg del temps. El CIVAL representa un punt de partida fonamental per al treball lexicogràfic, gramatical i onomàstic de la nostra institució. L’evolució de la lexicografia moderna fa que siga indispensable recórrer a una gran base de dades textual que permeta resseguir l’evolució de qualsevol paraula i determinar, consegüentment, la conveniència d’incorporar-la o no als diccionaris, a partir de l’ús que se n’ha fet al llarg del temps. Alhora, este fons documental també servirà com a observatori per a detectar les innovacions lèxiques que es vagen produint en els textos més actuals, així com per a fer estudis de sintaxi basats en l’ús real de la llengua.
En l’actualitat, el CIVAL el componen més de dotze mil documents, que abasten des de l’any 1257 (amb el Llibre del repartiment de Jaume I com a obra primigènia) fins al moment actual, en un procés en continu creixement. Cal entendre com a documents obres complexes i textos breus de la més variada tipologia textual: tant obres literàries com textos científics i de divulgació, i també dietaris, escriptures notarials, llibres de família, textos legals, articles de premsa i fins i tot textos de blogs o cançons de grups de música actuals. L’objectiu global de tot este conjunt de textos és poder fer una radiografia dels diversos usos del valencià. Les obres més antigues s’han integrat generalment en la base de dades a partir d’edicions i transcripcions fidels a l’original i rigoroses des del punt de vista ecdòtic; en tots els casos es dóna la referència bibliogràfica completa que permet identificar la font. Els criteris de representativitat per a la inclusió en el corpus atenen la variació lingüística, territorial, discursiva i estilística. Així, el corpus s’organitza en un subcorpus diacrònic, que comprén des dels orígens fins a l’aprovació de les Normes de Castelló, en 1932, com a data simbòlica de la modernització ortogràfica, i en un subcorpus del valencià actual, que oferix una visió sincrònica dels usos contemporanis del valencià.
Més enllà de la utilitat que un projecte com el CIVAL té per als treballs de l’AVL, considerem que este pot ser també molt profitós per a tots els estudiosos de la llengua, en la mesura que podran consultar les fonts documentals i extraure'n conclusions contrastades i fiables. I també, per descomptat, per a tots els interessats a conéixer més profundament el valencià. Per això, l’AVL ha pres la determinació de posar a l’abast de tots els ciutadans esta aplicació informàtica: perquè qualsevol persona interessada puga aprofitar-la per a aprofundir en el coneixement de la llengua pròpia i, alhora, facilitar la realització d’estudis filològics o literaris que difonguen la nostra cultura.
Contràriament a l’orientació d’uns altres corpus que es fornixen de fragments d’extensió regular de diverses fonts amb la intenció d’oferir uns resultats equilibrats, el CIVAL perseguix un ideal d’exhaustivitat on estiguen totes les obres i documents significatius escrits en valencià, sobretot pel que fa al Corpus diacrònic. Això ens obliga a estar en constant renovació incorporant-hi contínuament nova documentació. D’altra banda, la utilitat d’un corpus ve determinada per la capacitat de ser consultat i retornar informació. S’ha fet un gran esforç per a facilitar les busques complexes amb categories semàntiques, anotades amb etiquetes categorials. El CIVAL, per tant, no és una obra acabada; ni ho ha d’estar mai: això serà precisament un bon senyal de la salut de la nostra cultura. Ha de discórrer paral·lelament a l’evolució de la nostra llengua i del desenrotllament de la nostra filologia, de manera que constantment s’hi introduïsquen nous textos, tant antics com moderns, que enriquiran el seu valor.
Cal dir, finalment, que este projecte ha sigut possible gràcies a la generosa col·laboració de moltes editorials i institucions valencianes, autors i estudiosos que ens han cedit les seues obres. I per això també voldríem que la consulta d’esta base de dades servira d’estímul per a conéixer més profundament els nostres escriptors. Ells són, al cap i a la fi, els artífexs de la nostra cultura literària i la matèria primera del CIVAL, i per a ells és el nostre reconeixement primordial.