Kapsin logo

Kapsi Internet-käyttäjät ry

Irssi ja UTF-8

Unicode on uusi merkistöstandardi, joka sisältää lähes kaikkien kielien merkit. Lisäksi mukana on matemaattisia merkkejä sekä erilaisia symboleja. IRC:ssä unicodesta käytetään yleensä koodausta UTF-8, erityisesti kansainvälisillä kanavilla. UTF-8 on myös käytössä joissakin Linux-jakeluversioissa, kuten esimerkiksi Ubuntussa.

Tämä ohje neuvoo Irssin konfiguroinnin siten, että irkkiin päin puhutaan oletuksena UTF-8 -merkistöä.

  1. Asetetaan päätteen merkistö UTF-8:ksi. PuTTY:ssä tämä löytyy asetusvalikosta Window → Translation → Character set → UTF-8.

    Jos joskus tulee tarvetta käyttää screeniä päätteeltä, jossa UTF-8-tukea ei ole, voi komentaa screenin avauksen jälkeen ctrl-a :utf8 on off.

  2. Käynnistetään screen ja irssi:

    screen irssi
    
  3. Irssin merkistöksi päätteeseen päin asetetaan UTF-8:

    /set term_charset UTF-8
    
  4. Turvallisin vaihtoehto on asettaa IRC-keskustelun merkistöksi UTF-8, sillä se on tuettu kaikilla nykyaikaisilla ohjelmilla ja sitä käytetään kansainvälisillä kanavilla:

    /set recode_out_default_charset UTF-8
    
  5. Tallennetaan Irssin asetukset:

    /save
    

Kanavanimet joissa on ääkkösiä

Mikäli kanavan nimessä on ISO 8859-15 -merkistön ääkkösiä, ei join-komento suoraan toimi. Sen sijaan kanavalle pääsee seuraavasti:

/eval /join #\344\344kk\366nen

Kanavan nimestä siis korvataan ä \344:llä ja ö \366:lla.

UTF-8:n poistaminen käytöstä

Osa käyttäjistä haluaa palata kokonaan ISO 8859-15 -merkistöön, jos esimerkiksi terminaaliohjelma ei tue UTF-8:aa. Tämäkin onnistuu seuraavalla käskyllä shellissä:

echo export LC_ALL="en_US.ISO8859-15" >> ~/.bash_profile

Käsky lisää merkistön asettamisen kirjautumistiedoston loppuun.

Käskyn ajamisen jälkeen täytyy kirjautua uudelleen sekä joissain tapauksissa sammuttaa ja käynnistää myös irssi ja screen uudestaan.