Pół internetu używa Unicode, a my co?

decode unicode poster

Według Google niemal 50% stron w internecie używa kodowania znaków w unikodzie. Dokładna liczba może być nieco inna, bo brane pod uwagę są strony indeksowane przez Google. Wykres pokazuje bardzo szybki wzrost od jakichś czterech lat, a ponieważ rozwój technologii postępuje wykładniczo, już za rok tylko margines będzie używał innego kodowania ;)

To i tak za mało, właśnie brak unikodu nie pozwala mi zamówić np. książek w Amazonie (gdzie króluje ISO-8859-1) na własne nazwisko, literka ź nijak nie chce się prześlizgnąć przez ichnie formularze ;) Nie mówiąc już o tym, że wyszukanie czegokolwiek co ma w nazwie znaczki nie występujące w Latin-1 nie jest możliwe. Z pierwszej dwudziestki najbardziej popularnych stron wg Alexy, poza chińskimi, właśnie tylko Amazon nie używa Unicode. Google, zarówno na google.com jak i na stronach w  językach lokalnych od dawna już używa unikodu, również do wyszukiwania – wszelkie informacje są najpierw konwertowane z innych stron kodowych do Unicode.

A jak jest u nas? Postanowiłem to sprawdzić. I niestety „polski” internet nie wygląda w tym porównaniu najlepiej. Pod uwagę wziąłem strony z pierwszej dwudziestki zestawienia Alexa, wspomagane wynikami Megapanelu z listopada zeszłego roku, plus własny wybór bardziej znanych witryn. Nie jestem w stanie policzyć jak to wygląda wg zasięgu, czy ilości stron, ale już na pierwszy rzut oka widać, że większość stron i największych portali unikodu nie używa.

Polskie strony używające Unicode

początkowa kolejność wg Alexa, potem wg własnego uznania ;)

  • Nasza klasa
  • Allegro
  • Demotywatory
  • O2 (ale już należący do nich Pudelek nie)
  • Wrzuta
  • FilmWeb
  • OtoMoto
  • Panorama Firm
  • Ceneo
  • Wykop
  • Blip
  • empik.com

również lokalne Google, Microsoft, Apple, Facebook, YouTube, Wikipedia itp.

A teraz niechlubna ;) lista polskich stron nie używających Unicode

Portale, serwisy społecznościowe itp.

  • Onet
  • Wirtualna polska
  • Interia
  • Gazeta.pl
  • Money.pl
  • Grono

Banki internetowe

  • PKO BP (również Inteligo)
  • Citi Handlowy
  • Bank BPH
  • Millenium
  • Alior Bank
  • Kredyt Bank – tu kuriozum, jedyna większa strona, jaką znalazłem, używająca kodowania Windows-1250! Strony banku internetowego mają już na szczęście ISO 8859-2, ale strony informacyjne CP-1250.

Sklepy, porównywarki itp.

  • merlin
  • agito.pl
  • skąpiec

Jak widać ta lista jest dość obszerna. W przypadku portali informacyjnych kodowanie ma może mniejsze znaczenie, znaki spoza zakresu można zawsze przedstawić za pomocą encji, ale już wyszukiwanie niestety jest znacznie utrudnione. Bankom też to w sumie nie przeszkadza, choć powinny być raczej bardziej innowacyjne. Natomiast już w przypadku sklepów, szczególnie oferujących artykuły z obcojęzycznymi nazwami/tytułami, a także porównywarek cen brak Unicode jest poważnym naruszeniem użyteczności, utrudniając, lub wręcz uniemożliwiając wyszukanie nazw zawierających obce znaki spoza zakresu.

A blogi?

Tu jest różnie. Bloger jak całe Google ma Unicode, podobnie WordPress.com, jak również blogi na własnym hostingu napędzane WordPressem – już od dawna domyślnym kodowanie zarówno w bazy jak i zaplecza bloga jest Unicode. Niektóre starsze instalacje, szczególnie na niepewnych hostingach mogą czasem być w innym kodowaniu.

Należący do Agory blox, jak cała reszta niestety ma kodowanie ISO 8859-2, to samo blogi na Onecie i (też onetowy) Blog.pl.  Zaawansowany edytor bloxa pozwala na używanie dowolnych znaków, również spoza ISO, wstawiając je właśnie jako encje, ale spróbujcie potem wyszukać jakiś egzotyczny tekst w jeszcze bardziej egzotycznym języku ;) Jogger i Salon24 używają Unicode.

Na szczęście już prawie nikt nie używa CP-1250, co jeszcze kilka lat temu było przekleństwem, szczególnie Usenetu, bo przeglądarki internetowe zawsze sobie z tym radziły, pod warunkiem zadeklarowania kodowania zgodnie z naprawdę użytym.

Nie instalujcie WordPressa 2.5!

Jeśli jeszcze nie zainstalowaliście WordPressa 2.5 to możecie dziękować Bogu. A jeśli nieopatrznie juz to zrobiliście, to usuńcie go jak najszybciej! Może jeszcze nie jest za późno.

wpupdate.png

Od kilku dni wszyscy blogerzy atakowani są natarczywym komunikatem, nakazującym instalację nowej wersji. Jak donosi chiński blog Jedi.org prowadzony przez dysydenta Mace Windu, Matt M. razem z całą firmą Auto.matt, w zamian za ustępstwa rządu chińskiego w sprawie uwolnienia chińskich blogów na platformie WordPress.com, zgodził się umieścić w kodzie najnowszej wersji WordPressa konia trojańskiego, który po zainstalowaniu na blogu infekuje nie tylko samego bloga i jego środowisko, ale również komputer autora, a także wszystkie komputery osób odwiedzających bloga, które pozostawiły jakikolwiek komentarz. Podobno kod tego trojana jest tak skomplikowany, że właśnie jego implementacja spowodowała tak znaczne opóźnienie wydania wersji 2.5 oraz pominięcie wersji 2.4, w której złośliwy kod mógł zostać wykryty.

Jedynym ratunkiem, jak pisze Mace Windu, jest natychmiastowe odinstalowanie WP i przejście w trybie pilnym na wersję najwyżej 0.91, ewentualnie na platformę blox.XXX. Jeśli deinstalacja nastąpi do 48 godzin po zainfekowaniu, ofiarom grozi co najwyżej krótka przerwa i częściowe wyczyszczenie portfeli i automatyczne usunięcie z bloga wszelkich haseł i banerów popierających wolny Tybet. Jeśli od zarażenia upłynęło więcej czasu, jedynym wyjściem jest wpłacenie dobrowolnej darowizny na dowolne konto i dowolny cel, oraz dostarczenie skanu dowodu do chińskiej ambasady w kraju w którym prowadzony był hosting – tylko w tym przypadku blog zostanie odblokowany.

Kod Trojana jest tak silny, że pracujące nad nim od kilku dni specjalne oddziały służb SIS, Lakam i USSS, wsparte siłami CBA musiały oderwać od prac przy hakierowaniu mrocznego linusku samego Ch.Ch zwanego Ch.Ch., który ma wesprzeć siły jasnej strony. Prace nad wynalezieniem skutecznego antidotum trwają. Pozostaje tylko czekać i mieć nadzieję. I jak najszybciej usunąć złowrogą wersję WordPress 2.5

źródło Money.plStrona vvordpress.org została zamknięta przez służby specjalne, a twórcy chwilowo internowani w oblężonej twierdzy. Matt próbował ukryć się w naszym kraju, wspomagany przez niejakiego Fanatyq’a (z Lipiec Reymontowskich), który jak się mówi na mieście, był śpiochem i czekał tylko na sygnał, namawiając niewinnych do używania WordPressa na swoim blogu, zwanym dla niepoznaki polskim bloggerem ;) Jednakże Matt został aresztowany (co widać na zdjęciu obok) a Fanatyq jest nadal poszukiwany.

Cieszę się, że nie udało mi się upgrade’ować bloga do wersji 2.5. Przeczucie jakieś czy co? Albo zadziałały siły wyższe, żeby i Was miał kto ostrzec.

Blog przyjazny dla środowiska

Wraz z codzienną porcją ulotek, gazetek i innych reklam (na niecałych 200 metrach pięciu lub więcej „rozdawców”), wpadła w moje ręce dodawana do dzisiejszego wydania metra wkładka firmowana przez Biuro Ochrony Środowiska UM St. Warszawy, w całości poświęcona racjonalnej gospodarce odpadami Czytaj dalej Blog przyjazny dla środowiska

Gdzie pisać bloga

Istnieje wiele rozwiązań, gotowych platform blogowych i wybór jednej z nich może naprawdę przyprawić o zawrót głowy. Nie chcę tu sugerować konkretnego wyboru, choć na końcu przedstawię moje propozycje, gdyż wybór zależy od wielu czynników, które chcę tu pokrótce opisać.

Przed wyborem swojej platformy do pisania bloga, warto chwilę się zastanowić. Jest to ważna decyzja i nie warto podejmować jej zbyt pochopnie. Oczywiście zawsze można zmienić już raz wybraną platformę na inną, ale zawsze będzie wiązać się to z dodatkowymi kosztami (niekoniecznie w wymiarze ściśle finansowym), a na pewno będzie to wymagało dodatkowej pracy lub przynajmniej oczekiwania na uaktualnienie danych w wyszukiwarkach internetowych w przypadku zmiany domeny naszego bloga.
różne platformy blogowe
Wybór zależy od kilku (przynajmniej kilku, zapewne jest ich więcej, ja wymienie kilka najważniejszych wg mnie) czynników:

  1. Czy ma to być blog zupełnie prywatny, opisujący tylko jakiś wycinek naszego życia, czy też bardziej profesjonalny, nastawiony na szersze grono czytelników? – tu trzeba wziąć pod uwagę kilka kwestii: jak duży ruch będzie generował nasz blog, jakie dodatkowe opcje (np. statystyki odwiedzin) będą nam potrzebne, itp.
  2. Czy mamy zamiar (od razu lub w przyszłości) spróbować zarobić na swoim blogu i umieścić na nim reklamy? – niektóre serwisy blogowe mogą wyświetlać własne reklamy, lub zakazywać umieszczania reklam.
  3. Jak bardzo jesteśmy zaawansowani technicznie (język HTML, style, itp)? – niektóre platformy wymagają pewnej wiedzy, inne są łatwe do uruchomienia nawet dla laików komputerowych.
  4. Jakimi funduszami dysponujemy i ile pieniędzy możemy przeznaczyć na uruchomienie i utrzymanie bloga? – są opcje zupełnie bezpłatne, są też inne wymagające zainwestowania różnych kwot.
  5. Warto też dowiedzieć się, gdzie blogują inni – można spytać przyjaciół, znajomych, dzielących wspólne zainteresowania, gdzie prowadzą swojego bloga – na starcie pomoc kogoś znającego już to narzędzie może być nieoceniona w przypadku gdy nie mamy żadnego doświadczenia.
    Tu aż prosi się o zorganizowanie ankiety na temat miejsca pisania bloga przez czytelników, ale obawiam się, że mój blog ma jeszcze zbyt mały zasięg, więc wyniki nie byłyby miarodajne. Może np. Polski blogger (jeśli Fanatyk to przeczyta) podjąłby się tego zadania? Zapraszam ;)

Update: zdecydowałem się jednak sam na przeprowadzenie ankiety. Zapraszam do wzięcia udziału.
Czytaj dalej Gdzie pisać bloga