Mákká Regnor | 6 Nov 14:21 2006
Picon
Picon

Re: Did you drop Nothern Saami from the language choice list in d-i?

[Petter Reinholdtsen:]
> 
> Hi.  Did you drop Nothern Saami from the language choice list in d-i?
> We need it to be present in Debian Edu, to make sure the nothern saami
> users have a way to get their keyboard setting and locale enabled at
> install time.  If it isn't available in the default debian boot
> images, we will have to build our own custom boot images, and I would
> rather avoid that.  Is there some way we can get that language option
> back?  I know the translations are lacking, and there is little hope
> of finding active translators any time soon.  But we care most about
> the effect the language choice have on the installed system, and thus
> want that language option present even if d-i translations are
> missing.

Would you please drop the use of the bastard "Saami" then referring to the Sámi language.  "Saami" is
borrowed from Finnish, I'd guess.

Eale dearvan

---

Regnor Jernsletten, Centre for Sámi Studies,
University of Tromsø, Norway.  <http://www.sami.uit.no>
Sámi dieðalaš áigečála <http://www.sami.uit.no/aigecala/indexuc.html>
Petter Reinholdtsen | 6 Nov 13:39 2006

How to write saami with only ASCII letters? (Was: Did you drop Nothern Saami from the language choice list)

[Mákká Regnor]
> Would you please drop the use of the bastard "Saami" then referring
> to the Sámi language.  "Saami" is borrowed from Finnish, I'd guess.

How should I write it using ASCII characters (non-accented) only?  I
thought Saami was the prefered writing, but can use another if Saami
isn't the best one.  When I am able to use accented characters, I will
try to remember to use Sámi, but I often need to limit myself to
a-zA-Z. :)

Friendly,
--

-- 
Petter Reinholdtsen
Mákká Regnor | 6 Nov 15:32 2006
Picon
Picon

Re: How to write saami with only ASCII letters? (Was: Did you drop Nothern Saami from the language choice list)

[Petter Reinholdtsen:]
> [Mákká Regnor]
> > Would you please drop the use of the bastard "Saami" then referring
> > to the Sámi language.  "Saami" is borrowed from Finnish, I'd guess.
> 
> How should I write it using ASCII characters (non-accented) only?  I
> thought Saami was the prefered writing, but can use another if Saami
> isn't the best one.  When I am able to use accented characters, I will
> try to remember to use Sámi, but I often need to limit myself to
> a-zA-Z. :)

I see your point.  I'd prefer Sami instead of Saami.  If you're prepared to go to extremes, you might try some of
8-bit charmaps in /usr/share/i18n/charmaps/
 

Eale dearvan

---

Regnor Jernsletten, Centre for Sámi Studies,
University of Tromsø, Norway.  <http://www.sami.uit.no>
Sámi dieðalaš áigečála <http://www.sami.uit.no/aigecala/indexuc.html>
Petter Reinholdtsen | 10 Nov 12:01 2006

Re: Nordsamisk stavekontroll?


Da har jeg fått hodet litt over vannet, og kunne tenke meg å forsøke å
lage Debian-pakker av stavekontrollen for Nordsamisk.  Hvor kan jeg
laste ned en tarball med kildekoden?  Jeg savner en 'download'-lenke
fra <URL:http://divvun.no/english.html>.

Jeg har forstått at bygging og bruk av aspell-ordlisten tar mye
diskplass og minne, men det er ikke et akutt problem for meg og min
maskin med 2 GiB RAM. :)

Vennlig hilsen,
--

-- 
Petter Reinholdtsen
Petter Reinholdtsen | 10 Nov 12:05 2006

Re: How to write saami with only ASCII letters?


[Mákká Regnor]
> I see your point.  I'd prefer Sami instead of Saami.  If you're
> prepared to go to extremes, you might try some of 8-bit charmaps in
> /usr/share/i18n/charmaps/

OK, if Sami and Northern Sami is the preferred version, I'll use that
instead.  Should the debian-installer language choice and the locale
file be changed as well?  Børre used Saami in all the files he
created, for example /usr/share/i18n/locales/se_NO on a recent Linux
installation.  I guess that is where I got the 'Saami' name from.

Friendly,
--

-- 
Petter Reinholdtsen
Børre Gaup | 10 Nov 14:59 2006
Picon

Re: How to write saami with only ASCII letters?

On Fri, November 10. b. 2006 12:05, Petter Reinholdtsen wrote:
> [Mákká Regnor]
>
> > I see your point.  I'd prefer Sami instead of Saami.  If you're
> > prepared to go to extremes, you might try some of 8-bit charmaps in
> > /usr/share/i18n/charmaps/
>
> OK, if Sami and Northern Sami is the preferred version, I'll use that
> instead.  Should the debian-installer language choice and the locale
> file be changed as well?  Børre used Saami in all the files he
> created, for example /usr/share/i18n/locales/se_NO on a recent Linux
> installation.  I guess that is where I got the 'Saami' name from.
>

I have used Saami, but went over to use Sami a year ago ... Just felt it 
fitted better.

--

-- 
Børre Gaup
Børre Gaup | 14 Nov 10:20 2006
Picon

Re: Re: Nordsamisk stavekontroll?

On Fri, November 10. b. 2006 12:01, Petter Reinholdtsen wrote:
> Da har jeg fått hodet litt over vannet, og kunne tenke meg å forsøke å
> lage Debian-pakker av stavekontrollen for Nordsamisk.  Hvor kan jeg
> laste ned en tarball med kildekoden?  Jeg savner en 'download'-lenke
> fra <URL:http://divvun.no/english.html>.
>

Om du gjør en anonym cvs opplasting av gt modulen med kommandoene:

cvs -d :pserver:anonymous <at> victorio.uit.no:/usr/local/cvs/repository login
cvs -d:pserver:anonymous <at> victorio.uit.no:/usr/local/cvs/repository co gt

(forøvrig beskrevet her: http://www.divvun.no/doc/infra/anonymous-cvs.html)

så finner du en aspell tar-ball i gt/

Når du pakker den ut, finner du bl.a. en fil som heter sme.wl der. Den er 
eldgammel, og bør erstattes av en ny.

Du må da laste ned den yeste ordlista vår fra 
http://divvun.no/static_files/wordlist-sme-2006-11.13.txt.gz

Det er en fil på 1.6 GB, utpakket er den på 24GB. Denne fila må munches med 
fila munch.sh som du finner i gt/script/munch.sh

Bruk kommandoen på f.eks. denne måten:
munch.sh wordlist-sme-2006-11.13.txt sme.wl

Etter dette kan du erstatt den gamle .wl fila med den nye, og bygge i vei.

(Continue reading)

Petter Reinholdtsen | 15 Nov 18:12 2006

Re: Nordsamisk stavekontroll?

[Børre Gaup]
> Håper dette er til hjelp.

Absolutt.  Nå er jeg i gang, og så får vi se hvor langt jeg kommer før
jeg går meg fast.  Jeg oppdaget at script/munch.sh inneholdt litt vel
mye hardkodede stier.  Her er en patch som fikser de jeg har oppdaget
så langt.  Nå står den å kverner, og forhåpentligvis ser jeg et eller
annet resultat om noen timer.

Index: script/munch.sh
===================================================================
RCS file: /usr/local/cvs/repository/gt/script/munch.sh,v
retrieving revision 1.1
diff -u -3 -p -r1.1 munch.sh
--- script/munch.sh     13 Nov 2006 10:10:20 -0000      1.1
+++ script/munch.sh     15 Nov 2006 17:10:04 -0000
 <at>  <at>  -1,8 +1,10  <at>  <at> 
 #!/bin/bash

+basename="$(cd $(dirname $0)/..;pwd)"
+
 chars=($(cut -c 1-2 $1 | sort -u))
-#chars=($(head -n 1000 sme/aspell/sme.wl | cut -c 1-2))
-#chars=($(egrep -o '\b[^0-9]{2}\b' sme/aspell/begin.txt))
+#chars=($(head -n 1000 $basename/sme/aspell/sme.wl | cut -c 1-2))
+#chars=($(egrep -o '\b[^0-9]{2}\b' $basename/sme/aspell/begin.txt))
 counter=0

 echo
 <at>  <at>  -17,7 +19,7  <at>  <at>  for char in $(seq 0 $((${#chars[ <at> ]} - 1)
(Continue reading)

Petter Reinholdtsen | 17 Nov 13:33 2006

Re: Re: Nordsamisk stavekontroll?

[Petter Reinholdtsen]
> Nå står den å kverner, og forhåpentligvis ser jeg et eller annet
> resultat om noen timer.

Jeg har nå de første resultatene på plass, og det ser dårlig ut.
aspell segfaulter. :(

Prosessene blir 2 GiB, spiser det meste av resurser fra maskinen, og
da den kom til 4% begynte aspell å krasje.

Noen ide om hva det kan komme av?  Jeg bruker aspell 0.60.4-4 fra
debian/etch.  Jeg mistenker at det kommer av at prosessen ikke får mer
minne, men har ikke undersøkt nærmere hva som får den til å feile.

Jeg er litt usikker på hvordan jeg skal fortsette herfra, men to
muligheter er å brukte gdb/valgrind på aspell for å se hvorfor det
krasjer og å redusere filstørrelsene ved å bruke tre tegn i stedet for
to tegn ved grupperingen.

Vennlig hilsen,
--

-- 
Petter Reinholdtsen
Sjur Nørstebø Moshagen | 17 Nov 13:50 2006
Picon
Picon

Re: Re: Nordsamisk stavekontroll?

Den 17. nov. 2006 kl. 14.33 skrev Petter Reinholdtsen:

> [Petter Reinholdtsen]
>> Nå står den å kverner, og forhåpentligvis ser jeg et eller annet
>> resultat om noen timer.
>
> Jeg har nå de første resultatene på plass, og det ser dårlig ut.
> aspell segfaulter. :(

Problemet høyrest kjent ut:-) - og med 24 Gb input data istf 650Mb  
(om du har brukt den nyaste tekstfila Børre viste til), har det ikkje  
vorte lettare:-/

> Prosessene blir 2 GiB, spiser det meste av resurser fra maskinen, og
> da den kom til 4% begynte aspell å krasje.
>
> Noen ide om hva det kan komme av?  Jeg bruker aspell 0.60.4-4 fra
> debian/etch.  Jeg mistenker at det kommer av at prosessen ikke får mer
> minne, men har ikke undersøkt nærmere hva som får den til å feile.
>
> Jeg er litt usikker på hvordan jeg skal fortsette herfra, men to
> muligheter er å brukte gdb/valgrind på aspell for å se hvorfor det
> krasjer og å redusere filstørrelsene ved å bruke tre tegn i stedet for
> to tegn ved grupperingen.

Du kan prøva det (eg kjenner ikkje verktya). Vi har planar om å  
generera Aspell-oppføringar direkte frå kjeldeleksikona våre, men det  
arbeidet ligg eit stykke lenger fram i tid. Om vi får det på plass,  
fell heile munch-inga vekk. Vi kan istf få eit anna problem:  
bøyingsleksikona vil bli gigantiske i Aspell-målestokk. Skal bli  
(Continue reading)


Gmane