Mákká Regnor | 3 Jan 12:50 2005
Picon
Picon

Re: Samisk-ordlister godkjent av sametinget - utløser mer finansiering

[Børre Gaup:]
> En annen mulighet er å sette opp det web-baserte grensesnittet som den 
> Walisiske oversettergruppa bruker (har ikke lenker og navn i farta), 
> dette fjerner alle behov for å installere programvare.

Med andre ord: Økte kostnader fordi man må være på nett hele tida.

Godt nytt år, forresten ,)

--

-- 
Regnor Jernsletten, Centre for Sámi Studies,
University of Tromsø, Norway. <http://www.sami.uit.no>
Mákká Regnor | 3 Jan 13:28 2005
Picon
Picon

Re: Nordsamisk stavekontroll?

[Petter Reinholdtsen:]

> Jeg tror nordsamisk stavekontroll kan være innefor rekkevidde, hvis en
> går sammen med folkene bak <URL:http://www.speling.org/> og
> <URL:http://borel.slu.edu/crubadan/apps.html>. En kan da få hjelp til
> å bygge opp en samling nordsamisk tekst, og bruke denne til å bygge
> ordlister.

Jeg tok i min tid ut samtilige stregner i KDE for å lage orddelingsmønstre for LaTeX. Med grep og venner er
det ingen stor sak. Problemet er at den genererte lista bør korrekturleses, og det tar tid, og krever at
samisk rettskriving sitter i ryggmargen. Og det er en flaskehals, spør du meg. Hvor langt jeg er kommet
med mine to lister (enkeltord og sammensatte ord) husker jeg ikke lenger.

> Torstein Dybdahl har på i18n-no <at> fortalt at han har vært i kontakt med
> An Crúbadán-folkene og at de gjerne vil hjelpe til med å samle inn
> nordsamisk tekst. Se
> <URL:https://lister.ping.uio.no/pipermail/lister.ping.uio.no/i18n-no/2004-December/003203.html>
> for info om dette.

--

-- 
Regnor Jernsletten, Centre for Sámi Studies,
University of Tromsø, Norway. <http://www.sami.uit.no>
Petter Reinholdtsen | 3 Jan 16:59 2005

Re: Nordsamisk stavekontroll?


[Mákká Regnor]
> Jeg tok i min tid ut samtilige stregner i KDE for å lage
> orddelingsmønstre for LaTeX. Med grep og venner er det ingen stor
> sak. Problemet er at den genererte lista bør korrekturleses, og det
> tar tid, og krever at samisk rettskriving sitter i ryggmargen. Og
> det er en flaskehals, spør du meg. Hvor langt jeg er kommet med
> mine to lister (enkeltord og sammensatte ord) husker jeg ikke
> lenger.

Are you sure one need to check the word list if it is collected
automatically? Given enough text, one would start with the most
frequent ones, and I guess most people are able to spell them
correctly. :)

It would be interesting to see how many documents the web spider would
come up with if it is given a list of northern saami words. Hopefully
enough to create a initial corpus.
Mákká Regnor | 4 Jan 16:22 2005
Picon
Picon

Re: Nordsamisk stavekontroll?

[Petter Reinholdtsen:]
> 
> [Mákká Regnor]
> > Jeg tok i min tid ut samtilige stregner i KDE for å lage
> > orddelingsmønstre for LaTeX. Med grep og venner er det ingen stor
> > sak. Problemet er at den genererte lista bør korrekturleses, og det
> > tar tid, og krever at samisk rettskriving sitter i ryggmargen. Og
> > det er en flaskehals, spør du meg. Hvor langt jeg er kommet med
> > mine to lister (enkeltord og sammensatte ord) husker jeg ikke
> > lenger.
> 
> Are you sure one need to check the word list if it is collected
> automatically? Given enough text, one would start with the most
> frequent ones, and I guess most people are able to spell them
> correctly. :)
> 
> It would be interesting to see how many documents the web spider would
> come up with if it is given a list of northern saami words. Hopefully
> enough to create a initial corpus.

Since I'm not very happy regarding the idea of turning to English as
the working language of this forum, I'd reply:

Jeg får kike litt på den nettadressen du postet igår. Jeg er enig i
at man kan bygge opp et korpus over tid. Men målet må jo være at det
man ender opp med, faktisk kan ta (de grøvste) rettskrivingsblunderne
(dvs. korpuset kan ikke være helt uten kvalitetskontroll). Jeg tror
ikke vi (Skolelinux) er tjent med retteprogram som ikke følger
rettskrivingsnormen (man kan mene mye om normering av samiek, men det
temaet lar jeg ligge). Så kan man vente på at man får bedre
(Continue reading)

Gaute Hvoslef Kvalnes | 8 Jan 17:26 2005

KDE 3.4

Eg har no overført våre KDE-omsetjingar til versjon 3.4. I følgje 
utgjevingsplanen må omsetjingane vera ferdige til 2. februar for å koma 
med i 3.4 beta 2, og 26. februar for å koma med i den ferdige utgåva av 
KDE 3.4:

http://developer.kde.org/development-versions/kde-3.4-release-plan.html

Dei omsetjingane me har gjort fram til no på KDE 3.3.x er lagde inn i 
CVS-greina KDE_3_3_BRANCH, både i vår og i KDE sin CVS. KDE har enno 
ikkje bestemt seg for om dei skal gje ut endå ein 3.3.x-versjon, men 
dei store oppdateringane på samisk er jo eit lodd på vektskåla i så 
måte.

Med helsing,
 Gaute Hvoslef Kvalnes
Petter Reinholdtsen | 3 Jan 16:56 2005
Picon
Picon

Re: Samisk-ordlister godkjent av sametinget - utløser mer finansiering

[Mákká Regnor]
> Med andre ord: Økte kostnader fordi man må være på nett hele tida.

Some of us pay a fixed sum to be connected all the time. We will not
have any extra expenses. :)

But I agree with you in that there must be several ways to
participate. I am not too happy with web interfaces myself, and
prefer my trusty old emacs. :)

> Godt nytt år, forresten ,)

Thanks, and happy new year to you too, and everyone else on the
channel. :)
Petter Reinholdtsen | 19 Jan 22:26 2005

Re: [D-I] Automatic spellcheck of po files

The following came on debian-boot <at> og debian-i18n <at> today. It is
interesting for at least two reasons. It detects typos in the
debian-installer translations, and it provides words currently missing
in the dictionary.

I bet it is possible to run the scripts on the KDE and gnome
translations as well. The scripts are available in the d-i subversion
repository (scripts/l10n/l10n-spellcheck/).

[Davide Viti]
> "spellcheck" is a set of shell scripts written to simplify the task of
> spotting and correcting typos in po files; the main goal was to create
> a tool which could be used to improve the quality of translations for
> the debian-installer. Translators can use the language-specific files
> at:
> 
> http://d-i.alioth.debian.org/spellcheck
> 
> to find and check typos: for each supported language you'll find
> the following utf-8 encoded text files:
> 
> $LANG_all.txt (contains all the translated strings in $LANG language)
> $LANG_unkn_wl.txt (contains all the unknown words with their count)
> 
> If you want to work offline on the above files, you might prefere to
> download them in compressed format ($LANG.tar.gz)
> 
> 30 languages are currently supported and more languages will hopefully
> be added in the near future.
> 
(Continue reading)

Trond Trosterud | 20 Jan 15:28 2005
Picon
Picon

Re: Nordsamisk stavekontroll?


Den siste tida har det på denne lista vore diskusjon om å lage eit 
stavekontrollprogram for nordsamisk og inkludere det i 
Skuvlalinux-pakka.

Som fleire av dykk veit har Sametinget sett i gang eit treårig 
stavekontrollprosjekt. Prosjektet starta opp i oktober 2004, og målet 
er å lage nord- og lulesamiske stavekontrollar for Linux, Mac og 
Windows-plattformane, både integrert i kontorprogramvare, og 
integrerbare i andre program (dvs. program av ispell/aspell-typen). 
Sametinget sitt prosjekt er eit samarbeid med Universitetet i Tromsø 
sitt språkteknologiprosjekt. For eit inntrykk av korleis arbeidet går 
kan de gå til http://giellatekno.uit.no/d-sme.html og lime inn samisk 
tekst (t.d. frå http://www.minaigi.no/).

Resultata frå desse to prosjekta kjem til å bli tilgjengelege for alle, 
i form av open kjeldekode og gratis korrekturprogramvare klar til 
installasjon. Det gjeld dei grammatiske regelfilene, og det gjeld 
leksikonfilene som ligg i botn. Leksikonfilene er basert på Pekka 
Sammallahti sine ordbøker, men mange ord er lagt til. For ispell/aspell 
kjem vi ssv. til å generere fullformsordlister, som deretter vil bli 
komprimert automatisk og pakka i aspell/ispell-format. Vi vil vurdere 
etter kvart om det er mogleg å få til bøying av dei mest frekvente 
bøyingsklassane..

I dette arbeidet vil vi svært gjerne samarbeide med Skolelinux-miljøet.

Folk som har greie på samisk kan bli med på, eller bidra til, det 
språklege arbeidet. Dette kan skje på ulike måtar: De kan gje kopiar av 
ordlister, som vi kan køyre gjennom analysatoren vår, for å sjekke kva 
(Continue reading)

Børre Gaup | 26 Jan 01:28 2005
Picon

Re: KDE 3.4

Lávvardat, ođđajagemánu 8. b. 2005 17.26, Gaute Hvoslef Kvalnes čálii:
> Eg har no overført våre KDE-omsetjingar til versjon 3.4. I følgje
> utgjevingsplanen må omsetjingane vera ferdige til 2. februar for å koma
> med i 3.4 beta 2, og 26. februar for å koma med i den ferdige utgåva av
> KDE 3.4:
>
> http://developer.kde.org/development-versions/kde-3.4-release-plan.html
>
> Dei omsetjingane me har gjort fram til no på KDE 3.3.x er lagde inn i
> CVS-greina KDE_3_3_BRANCH, både i vår og i KDE sin CVS. KDE har enno
> ikkje bestemt seg for om dei skal gje ut endå ein 3.3.x-versjon, men
> dei store oppdateringane på samisk er jo eit lodd på vektskåla i så
> måte.
>
Mun lean jorgalan oalle ollu dál ovdal juovllaid. Jus veahkkehehpet mu veahaš, 
de šaddá sámegiella fas standárdgiellan go KDE 3.4 addejuvvo olggos.

Stáhtus dál lea:
			eahpečielga		jorgalkeahttá		jorgaluvvon
kdelibs:		74 (0,77%)		697 (7,25%)		8837 (91,98%)
kdebase:	404 (3,89%)		1859 (17,92%)	8113 (78,19%)
kdepim:		875 (8,56%)		5869 (57,42%)	3477 (34,02%)
kdemultimedia, kdenetwork: sullii 17% jorgaluvvon

--
Dearv.
Børre
Petter Reinholdtsen | 27 Jan 22:39 2005

Re: Nordsamisk stavekontroll?

[Trond Trosterud]
> I dette arbeidet vil vi svært gjerne samarbeide med
> Skolelinux-miljøet.

Dette høres helt fantastisk ut. Jeg vet ikke hvor jeg kan bidra, men
jeg vil støtte opp om dette arbeidet der jeg kan. Jeg er overbevist
om at den tekniske infrastrukturen som lages vil kunne komme alle
språk til gode, og at metodene som utvikles vil kunne brukes av flere.
I tillegg er jeg veldig glad for å høre at vi endelig har mulighet til
å få ordbok på de samiske språkene. Det har vi trengt så lenge. :)

Jeg har ikke peiling på hvor langt Torstein Hernes Dybdahl eller andre
er kommet med planene om å samle inn nordsamisk tekst som grunnlag for
ordlistearbeidet, men regner med at dette er teknologi og data som vil
kunne deles. KDE-oversettelsene inneholder allerede et utgangspunkt
av ord som kan brukes for å finne flere tekster, og hvis jeg forsto
Torstein rett, så var det tilstrekkelig til å komme igang.

I tillegg så har vi <URL: http://www.speling.org/ > som jeg oppfatter
som et første forsøk på å samkjøre utviklingen av ordlister. Det er
nok mye som gjenstår før en er i boks der, men det virker som om
danskene har kommet et stykke på vei med infrastrukturen for å
klassifisere ord på dugnad.

Uansett, dette er kun noen ideer fra en IT-fyr som ikke har mye
peiling på språk, ordlister og gramatikk-kontroll. Jeg vet ikke om
evnen til å bidra er tilstede, men viljen er absolutt her. :)

Gmane