24. 1. 2012 Besedilni korpusi
Besedilni korpusi
Besedilni korpusi so velike zbirke elektronsko obdelanih besedil, ki omogočajo temeljit vpogled v jezik na različnih področjih. Dajejo odgovore na številna vprašanja, vendar jih moramo tako kot vse druge jezikovne pripomočke znati uporabljati. To se je pokazalo tudi na našem pogovoru.
Presenetili so nas trije izkušeni avtorji besedilnih korpusov Fida in FidaPLUS – dr. Nataša Logar s Fakultete za družbene vede, dr. Simon Krek z Instituta Jožef Stefan in dr. Iztok Kosem s Trojine, zavoda za uporabno slovenistiko. Tako se nam je ponudila priložnost, da smo izmenjali izkušnje sestavljavci in uporabniki.
Pogovarjali smo se o referenčnih korpusih Nova beseda, Fida in FidaPLUS. Ti dajejo celovito podobo jezika in so izhodišče za sestavljanje slovnic in slovarjev.
Nova beseda je skupno delo Inštituta za slovenski jezik Frana Ramovša in ZRC SAZU – Laboratorija za korpus slovenskega jezika. Ugotovili smo, da ima ta korpus najširši krog uporabnikov. V njem je več kot tristo milijonov besed, a jih je kar dve tretjini izpisanih iz dnevnika Delo, kjer premalo skrbijo za jezik, da bi ta vir lahko bil zanesljiva podlaga za jezikovno normo.
Referenčni korpus Fida je nastal leta 1999 in je obsegal sto milijonov besed, leta 2006 pa mu je sledila FidaPLUS s šeststo milijoni besed.
Razveseljivo je, da je pri korpusih, ki še nastajata (GigaFida in Kres), manjši delež primerov iz dnevnega časopisja, večji poudarek pa je na leposlovju in drugih virih.
In še sklepna misel. Besedilni korpusi so tudi za lektorje pomemben vir pri iskanju pravilnih ali samo boljših možnosti, ves čas pa je treba imeti v mislih okolje, v katerem je bila beseda zapisana, in da sama pogostnost, torej absolutna številka, ne sme biti odločilna pri tehtanju, za katero besedo se bomo odločili.
Nepričakovano se nam je tokrat pridružila novinarka z Radia Slovenija, ki je z nami posnela pogovor o našem prizadevanju za izboljšanje jezika v javnem življenju.
Zapisala: Milojka Mansoor
Pretekle vsebine
-
1. Ta veseli dan kulture
3. 12. 2020
-
2. Spletni jezikovni pogovor
19. 11. 2020
-
3. Variantnost feminativnih obrazil -ica in -ka med normo in rabo
24. 9. 2020
-
4. Prednovoletni jezikovni pogovor
3. 12. 2019
-
5. Novembrski jezikovni pogovor
19. 11. 2019
-
6. Septembrski jezikovni pogovor
18. 9. 2019
-
7. Samostalniški prilastek
18. 6. 2019
-
8. Prvi popoldanski jezikovni pogovor
27. 2. 2019
-
9. Raba predlogov, drugič
17. 1. 2019
-
10. Raba predlogov
20. 11. 2018
-
11. Septembrski jezikovni pogovor
18. 9. 2018
-
12. Izbrana poglavja iz skladnje, drugič
12. 6. 2018
-
13. Izbrana poglavja iz skladnje
20. 3. 2018
-
14. Januarski jezikovni pogovor
18. 1. 2018
-
15. Viski, velnes, hešteg
19. 9. 2017
-
16. Krajšave – kratice, simboli, okrajšave
6. 6. 2017
-
17. Računalniški izrazi, zrcalnorefleksni, tropičje, temu ni tako ...
28. 3. 2017
-
18. Samostalniško izražanje v slovenščini
10. 1. 2017
-
19. Trpni način v slovenščini
4. 10. 2016
-
20. Prave lektorske paranorme
14. 6. 2016
-
21. Ki-stavki, oziralni relativniki
5. 4. 2016
-
22. Športna terminologija
2. 2. 2016
-
23. Zapisovanje avtomobilov
4. 9. 2013
-
24. Navedki in težave z ločili
3. 11. 2015
-
25. Je prav bombon ali bonbon?
4. 9. 2013
-
26. Imena iz nelatiničnih pisav, vrstni pridevnik ali predložna zveza, navedek ...
8. 9. 2015
-
27. Ujemanje in rodilnik ali tožilnik
4. 9. 2013
-
28. Jezikovni pogovor 16. 6. 2015
16. 6. 2015
-
29. O hektarih in gradnji
4. 9. 2013
-
30. Golfska terminologija
31. 3. 2015
-
31. Sklon za KOT
4. 9. 2013
-
32. Vprašanj o pridevniški besedi in še čem noče zmanjkati
31. 3. 2015
-
33. Višji Jaz ali višji jaz in podobni zgledi
4. 9. 2013
-
34. Težave pri rabi prislovov in predlogov
6. 1. 2015
-
35. Katere (vse) oblike so pravilne?
4. 9. 2013
-
36. Zanikanje v slovenščini, težji primeri
4. 11. 2014
-
37. Kako pravilno sklanjati?
4. 9. 2013
-
38. Jezikovna priporočila Janeza Gradišnika in njihova aktualnost danes
22. 10. 2014
-
39. Podaljšati z -j ali ne
4. 9. 2013
-
40. Sinonimni pridevniki
23. 9. 2014
-
41. BOŽJI z veliko in malo začetnico
4. 9. 2013
-
42. Pridevniška beseda, maj-junij 2014
27. 5. 2014
-
43. Beseda škoda v množini
4. 9. 2013
-
44. Določna in nedoločna oblika pridevnika
22. 4. 2014
-
45. Kako sklanjati ime in priimek: MIRKO ŠPEGU
4. 9. 2013
-
46. Količine in števniki
4. 3. 2014
-
47. Zapis odstotkov s simbolom ali besedo
4. 9. 2013
-
48. Razne jezikovne zadrege
7. 1. 2014
-
49. Zapis programske opreme
4. 9. 2013
-
50. Zloženke v pravopisu
19. 11. 2013
-
51. Bolniški stalež, dopust, odsotnost, bolniška
4. 9. 2013
-
52. Pomembna pravopisna vprašanja
8. 10. 2013
-
53. Jumbo plakat
4. 9. 2013
-
54. Tožilniško zanikanje in druge jezikovne zagate
13. 2. 2013
-
55. Nepravilne predložne zveze
23. 1. 2013
-
56. Pisati kranjska ali Kranjska klobasa
4. 9. 2013
-
57. Sodobni pravopisni priročnik med normo in predpisom, 3. del
5. 12. 2012
-
58. Pisanje datumov v slovenščini
4. 9. 2013
-
59. Sodobni pravopisni priročnik med normo in predpisom, 2. del
17. 11. 2012
-
60. To se ne dela
4. 9. 2013
-
61. Sodobni pravopisni priročnik med normo in predpisom
10. 10. 2012
-
62. Ali Mike - Mikea ali Mike Mika
4. 9. 2013
-
63. Podloga ali predloga; Fun Park, OBV-LAD-AM.
12. 9. 2012
-
64. Človek, ki opravi ultrazvok
4. 9. 2013
-
65. Velika začetnica
8. 5. 2012
-
66. Slovenska Istra ali slovenska Istra?
4. 9. 2013
-
67. Povratni osebni in povratni svojilni zaimek, drugo
10. 4. 2012
-
68. Twitter in tviteraši ali tvitarji
4. 9. 2013
-
69. Tako imenovani ki-stavki (in drugi oziralni stavki)
13. 3. 2012
-
70. SMS, s SMS ali z SMS
4. 9. 2013
-
71. O slovenskem pravopisu
14. 2. 2012
-
72. Bateau bleu
4. 9. 2013
-
73. Besedilni korpusi
24. 1. 2012
-
74. Jud, jud, Žid, žid
4. 9. 2013
-
75. Oglaševalci in jezik
13. 12. 2011
-
76. Družbeno ali družabno omrežje
4. 9. 2013
-
77. Športne zadrege
8. 11. 2011
-
78. Upariti ali spariti
4. 9. 2013
-
79. Dileme in spoznanja
14. 9. 2011
-
80. Zapis zneska z besedo
4. 9. 2013
-
81. Prevzemanje besed
14. 6. 2011
-
82. Ona se ne čuti krivo, kriva
4. 9. 2013
-
83. Napake v besednem redu
12. 5. 2011