Prva stranŠtevilka 3–4/2003 ~ Issue 3–4/2003

PDF DATOTEKEMarko Stabej: Jezikovne tehnologije in jezikovno načrtovanje. Jezik in slovstvo. 3–4/2003. 5–18.
Jezikovne tehnologije po eni strani s svojo dejavnostjo krepijo tradicionalne jezikovnonačrtovalne procese, torej načrtovanje statusa in korpusa jezika, po drugi strani pa imajo tudi druge učinke, ki jih je treba sociolingvistično šele ovrednotiti, saj niso kar apriori pozitivni. Za konstruktivno sinergijo tehnologije in jezikovnega načrtovanja je potrebno interdisciplinarno sodelovanje humanističnih in informacijskotehnoloških disciplin pri vseh odločilnih fazah razvoja jezikovnotehnoloških aplikacij.

Marko Stabej: Language Technologies and Language Planning. Jezik in slovstvo. 3–4/2003. 5–18.
On the one hand, language technologies strengthen the traditional language planning processes, i.e. the planning of the status and the corpus of the language, but on the other hand, they have other effects as well, which still need to be assessed from a sociolinguistic perspective, since they are not positive a priori. For a constructive synergy of technology and language planning, an interdisciplinary co-operation of disciplines from the fields of humanities and IT is necessary in all the decisive stages of the development of language technology applications.Vojko Gorjanc: Korpusi in jezikoslovje. Jezik in slovstvo. 3–4/2003. 19–27.
S prihodom korpusov je v jezikoslovju na voljo več kakovostnih podatkov o jezikovni realnosti kot kadarkoli prej. Z razvojem metodologij gradnje in analize korpusov pa se je razvila tudi metodologija, ki omogoča temeljit vpogled v jezikovno delovanje in učinkovite jezikovne opise. Ob uporabniško usmerjenih gradivnih opisih jezika in njegovega delovanja pa se oblikujejo tudi novi strokovni diskurzi, ki se sopostavljajo tradicionalnim; v današnji družbi znanja se namreč načini ustvarjanja in prenašanja znanja ter intelektualnih veščin v njej oblikujejo v demokratičnem dialogu med ustvarjalci vedenja in tistimi, ki to vedenje potrebujejo.

Vojko Gorjanc: Corpora and Linguistics. Jezik in slovstvo. 3–4/2003. 19–27.
With the emergence of corpora, more quality data on linguistic reality is available in linguistics than ever before. With the development of the methodology of corpus collection and corpus analysis, methodology enabling a thorough insight into language operation and effective language description has developed as well. Along with user-directed material descriptions of language and its operation, new professional types of discourse are formed which are juxtaposed to the traditional types; in today's society of knowledge, its ways of creating and transmitting knowledge and intellectual skills are formed in a democratic dialogue between the creators of knowledge and those who need this knowledge.Simon Krek: Jezikovni priročniki in novi mediji. Jezik in slovstvo. 3–4/2003. 29–46.
Članek opisuje slovenske jezikovne priročnike in druge vire podatkov o slovenskem jeziku, ki se nahajajo v neknjižnem digitalnem okolju. Začenja s slovarji kot klasičnimi priročniki v različnih računalniških oblikah, preko leksikonov besednih oblik in jezikovnih korpusov kot novih oblike jezikovnih priročnikov do popolnoma računalniških jezikovnih orodij, ki jih najdemo v urejevalnikih besedil, avtomatskih prevajalnih sistemov in govornih tehnologij. Zaključuje s kratko oceno stanja in predvidevanji glede nadaljnjega razvoja.

Simon Krek: Language Reference Books and The New Media. Jezik in slovstvo. 3–4/2003. 29–46.
The article deals with reference books and other sources of data about the Slovenian language found in digital form. It begins with dictionaries as classic reference books in various computer environments, followed by morphological lexicons and language corpora as the new types of reference tools and finally language proofing tools found in text processors, translation software and speech technologies. The article ends with a short assessment of the current situation and predictions for future development.Jerneja Žganec Gros: France Mihelič in Simon Dobrišek, Govorne tehnologije: pridobivanje in pregled govornih zbirk za slovenski jezik. Jezik in slovstvo. 3–4/2003. 47–59.
Govorne zbirke so nepogrešljive pri raziskovalnem delu na področju tehnologij govorjenega jezika. Vsebujejo predvsem računalniško berljive posnetke govora. Posnetkom so vedno priloženi še podatki, ki na različne načine opisujejo posneti govor. Priloženi podatki so opisi govornih dejavnikov, dejavnikov govorcev ter zapisi in označitve posnetega govora. Pogosto govorni zbirki priložimo še navodila za uporabo ter rezultate izbranih analiz govornih posnetkov. Članek opisuje osnovne gradnike govornih zbirk ter postopek zasnove, snemanja, segmentacije, označevanja in analize govornih zbirk. V sklepnem delu se nahaja pregled govornih zbirk za slovenski jezik.

Jerneja Žganec Gros: France Mihelič and Simon Dobrišek, Design and Overview of Slovene Speech Corpora. Jezik in slovstvo. 3–4/2003. 47–59.
Speech corpora are an essential infrastructure element for speech technologies research in a given language. Speech corpora consist of machine–readable speech recordings. They are further equipped with additional data, such as speaker and recording session descriptors and different segmentation and annotation elements, e.g. graphemic, phonetic and prosodic transcriptions or descriptors. In the article we describe the process of designing a speech corpus – from text or topic selection, recording, segmentation and labelling procedures. We conclude with an overview of speech corpora for the Slovene language.Tomaž Erjavec: Označevanje korpusov. Jezik in slovstvo. 3–4/2003. 61–76.
Urejene računalniške zbirke besedil, korpusi, so uporabni v številnih vejah jezikoslovja. Prispevek se osredotoči na računalniški zapis korpusov, predvsem na njihovo označevanje, tj. dodajanje interpretativnih informacij besedilu v korpusu. Predstavljeno označevanje temelji na upoštevanju mednarodnih standardov s tega področja, kar doprinese k boljši dokumentiranosti in preverljivosti, enostavnejši uporabi programov za obdelavo, in k večji izmenljivosti ter trajnosti. V prvem delu obravnavamo standarde za računalniški zapis besedil, predvsem XML (eXtended Markup Language) in TEI (Text Encoding Initiative), v drugem pa orišemo nekaj bolj zanimivih ravni jezikoslovnega označevanja korpusov.

Tomaž Erjavec: Corpus Annotation. Jezik in slovstvo. 3–4/2003. 61–76.
Ordered collections of machine-readable texts, corpora, are useful in various branches of linguistics. The present paper focuses on the machine-readable form of corpora, above all on their annotation, i.e. adding interpretative information to the text in the corpus. The annotation presented is based on taking into consideration the international standards from this field, which contributes to better documentation and verifiability, easier use of processing applications, and better interchange and longevity. In the first part, corpus encoding standards, above all XML (eXtended Markup Language) and TEI (Text Encoding Initiative), are discussed, while in the second part some of the more interesting levels of linguistic annotation of corpora are outlined.Špela Vintar: Kaj izvira iz jezikovnih virov,. Jezik in slovstvo. 3–4/2003. 77–88.
Jezikovni viri, kot so korpusi, leksikoni in tezavri, pa tudi označevalniki in druge temeljne tehnologije, niso sami sebi namen, temveč služijo za izdelavo pomembnih jezikovnih priročnikov in uporabniških aplikacij. Prispevek predstavi načine izrabe jezikovnih virov v jezikoslovne in nejezikoslovne namene s poudarkom na uporabniškem vidiku. Med prvimi omenjamo predvsem korpusne metode pri opisovanju jezika v leksikografiji, slovnici in prevodoslovju, nato sledi pregled širše znanih jezikovnih orodij, kot so črkovalniki, slovarji sopomenk ali prevajalniki. V zadnjem času se razvoj vse bolj osredotoča na pomensko usmerjene aplikacije, na primer razvrščanje in povzemanje dokumentov, iskanje podatkov in gradnjo ontologij. V drugem delu prispevka pobliže opišemo dve področji izrabe korpusnih virov, in sicer luščenje terminologije in pridobivanje medicinskih spoznanj s pomočjo rudarjenja besedil.

Špela Vintar: What is the Source of Language Resources. Jezik in slovstvo. 3–4/2003. 77–88.
Language resources such as corpora, lexica and thesauri as well as basic language analysis tools are needed on the one hand for linguistic description and the production of reference works, and on the other hand for the development of various user applications. The paper describes some areas of exploiting language resources for linguistic and other purposes from the user's perspective. The overview begins with corpus-based methods in lexicography, grammar and translation studies, then we briefly list some better-known technologies such as spell-checkers, thesauri and machine translation tools. In recent years the field is increasingly focussing on semantic applications for Document Classification and Summarization, Information Retrieval and Ontology Building. The second part of the paper presents two specific fields of exploiting language resources: Automatic Term Extraction and Knowledge Discovery in the medical domain through Text Mining.Nataša Hirci: Prevajanje danes in jutri: delo s sodobnimi prevajalskimi viri in orodji,. Jezik in slovstvo. 3–4/2003. 89–102.
V prispevku avtorica podaja možnosti dela prevajalcev s pomočjo nekaterih sodobnih prevajalskih virov in orodij v elektronski obliki. Pregled raznovrstnih jezikovnih tehnologij in elektronskih virov je podkrepljen z nekaterimi primeri dela s tovrstnimi prevajalskimi orodji za slovenski in angleški jezik, ki v času globalizacije in za Slovenijo pomembnih evropskih integracijskih procesov omogočajo vse hitrejše in učinkovitejše prevajanje določenih tipov besedil; tako morajo biti prevajalci, če želijo biti konkurenčni na vse zahtevnejšem prevajalskem trgu, tehnološko in informacijsko osveščeni in vešči prevajanja s sodobnimi prevajalskimi orodji.

Nataša Hirci: Translation Today and Tomorrow: The Implementation of Contemporary Translation Tools and Resources. Jezik in slovstvo. 3–4/2003. 89–102.
The present paper discusses various contemporary translations tools and resources in the electronic form available to translators. The overview of the different types of language technologies and electronic resources is corroborated with practical examples of applying such translation tools for the Slovene and the English language to translation. At the time of globalisation and European integration processes important to Slovenia, these tools facilitate a faster and more effective translation of certain text types; thus, translators aiming to remain competitive in the increasingly demanding translation market, need to be both familiar with IT and skilled in the implementation of contemporary translation tools.Agnes Pisanski: Uporaba novih tehnologij pri jezikovnem pouku. Jezik in slovstvo. 3–4/2003. 103–112.
V prispevku je predstavljen pregled možnosti uporabe novih tehnologij pri jezikovnem pouku. Uporaba novih tehnologij pri jezikovnem pouku je odvisna od pripravljenosti učitelja, da jih sprejme in uporabi v razredu, in od opreme, ki je za pouk na voljo. Posamezne možnosti za uporabo novih tehnologij so strnjene v tri sklope: namenske (oziroma za jezikovni pouk pripravljene), nenamenske in komunikacijske možnosti. Poleg kratkega opisa vsake od možnosti, so ocenjene tudi najpomembnejše prednosti in slabosti njene uporabe. Za vsak sklop so navedeni zgledi za uporabo pri jezikovnem pouku angleščine in slovenščine.

Agnes Pisanski: Using New Technologies in Language Teaching. Jezik in slovstvo. 3–4/2003. 103–112.
The paper presents an overview of the possibilities of using new technologies in language teaching. The use of new technologies in language teaching depends on both the willingness of the teacher to accept them and use them in the classroom, as well as the equipment available. The possibilities for using new technologies are grouped into three main categories: language teaching resources, general resources and electronic communication. In addition to a brief description of each of the possibilities, the most important advantages and disadvantages of its use are assessed as well. For each category, possible examples for English and Slovene language teaching are given.