Pół internetu używa Unicode, a my co?

decode unicode poster

Według Google niemal 50% stron w internecie używa kodowania znaków w unikodzie. Dokładna liczba może być nieco inna, bo brane pod uwagę są strony indeksowane przez Google. Wykres pokazuje bardzo szybki wzrost od jakichś czterech lat, a ponieważ rozwój technologii postępuje wykładniczo, już za rok tylko margines będzie używał innego kodowania ;)

To i tak za mało, właśnie brak unikodu nie pozwala mi zamówić np. książek w Amazonie (gdzie króluje ISO-8859-1) na własne nazwisko, literka ź nijak nie chce się prześlizgnąć przez ichnie formularze ;) Nie mówiąc już o tym, że wyszukanie czegokolwiek co ma w nazwie znaczki nie występujące w Latin-1 nie jest możliwe. Z pierwszej dwudziestki najbardziej popularnych stron wg Alexy, poza chińskimi, właśnie tylko Amazon nie używa Unicode. Google, zarówno na google.com jak i na stronach w  językach lokalnych od dawna już używa unikodu, również do wyszukiwania – wszelkie informacje są najpierw konwertowane z innych stron kodowych do Unicode.

A jak jest u nas? Postanowiłem to sprawdzić. I niestety „polski” internet nie wygląda w tym porównaniu najlepiej. Pod uwagę wziąłem strony z pierwszej dwudziestki zestawienia Alexa, wspomagane wynikami Megapanelu z listopada zeszłego roku, plus własny wybór bardziej znanych witryn. Nie jestem w stanie policzyć jak to wygląda wg zasięgu, czy ilości stron, ale już na pierwszy rzut oka widać, że większość stron i największych portali unikodu nie używa.

Polskie strony używające Unicode

początkowa kolejność wg Alexa, potem wg własnego uznania ;)

  • Nasza klasa
  • Allegro
  • Demotywatory
  • O2 (ale już należący do nich Pudelek nie)
  • Wrzuta
  • FilmWeb
  • OtoMoto
  • Panorama Firm
  • Ceneo
  • Wykop
  • Blip
  • empik.com

również lokalne Google, Microsoft, Apple, Facebook, YouTube, Wikipedia itp.

A teraz niechlubna ;) lista polskich stron nie używających Unicode

Portale, serwisy społecznościowe itp.

  • Onet
  • Wirtualna polska
  • Interia
  • Gazeta.pl
  • Money.pl
  • Grono

Banki internetowe

  • PKO BP (również Inteligo)
  • Citi Handlowy
  • Bank BPH
  • Millenium
  • Alior Bank
  • Kredyt Bank – tu kuriozum, jedyna większa strona, jaką znalazłem, używająca kodowania Windows-1250! Strony banku internetowego mają już na szczęście ISO 8859-2, ale strony informacyjne CP-1250.

Sklepy, porównywarki itp.

  • merlin
  • agito.pl
  • skąpiec

Jak widać ta lista jest dość obszerna. W przypadku portali informacyjnych kodowanie ma może mniejsze znaczenie, znaki spoza zakresu można zawsze przedstawić za pomocą encji, ale już wyszukiwanie niestety jest znacznie utrudnione. Bankom też to w sumie nie przeszkadza, choć powinny być raczej bardziej innowacyjne. Natomiast już w przypadku sklepów, szczególnie oferujących artykuły z obcojęzycznymi nazwami/tytułami, a także porównywarek cen brak Unicode jest poważnym naruszeniem użyteczności, utrudniając, lub wręcz uniemożliwiając wyszukanie nazw zawierających obce znaki spoza zakresu.

A blogi?

Tu jest różnie. Bloger jak całe Google ma Unicode, podobnie WordPress.com, jak również blogi na własnym hostingu napędzane WordPressem – już od dawna domyślnym kodowanie zarówno w bazy jak i zaplecza bloga jest Unicode. Niektóre starsze instalacje, szczególnie na niepewnych hostingach mogą czasem być w innym kodowaniu.

Należący do Agory blox, jak cała reszta niestety ma kodowanie ISO 8859-2, to samo blogi na Onecie i (też onetowy) Blog.pl.  Zaawansowany edytor bloxa pozwala na używanie dowolnych znaków, również spoza ISO, wstawiając je właśnie jako encje, ale spróbujcie potem wyszukać jakiś egzotyczny tekst w jeszcze bardziej egzotycznym języku ;) Jogger i Salon24 używają Unicode.

Na szczęście już prawie nikt nie używa CP-1250, co jeszcze kilka lat temu było przekleństwem, szczególnie Usenetu, bo przeglądarki internetowe zawsze sobie z tym radziły, pod warunkiem zadeklarowania kodowania zgodnie z naprawdę użytym.

Kto to są ci internauci?

Crowd Saying No!

Plany utworzenia Rejestru Stron i Usług Niedozwolonych, czyli potocznie mówiąc blokowania niektórych stron internetowych przez rząd (pomysł wyszedł z Ministerstwa Finansów (sic!) jako uniwersalne panaceum na wszelkie problemy z e-hazardem, a przy okazji z całym tym niezidentyfikowanym i bliżej nieznanym, a więc groźnym internetem) jest tak szeroko dyskutowany i w sieci i poza nią że w zasadzie nie potrzeba już nic więcej dodawać. Na Facebooku powstało przynajmniej kilka różnych stron protestu, ja też, jak chyba każdy, dostał masę informacji i zachęt do przyłączenia się od znajomych i nie.

Nie wiem czy taki protest w ogóle ma sens, skoro te plany i tak są podobno niezgodne z konstytucją oraz Europejską Konwencją Praw Człowieka i nawet jeśli rząd jakimś cudem przeprowadzi je przez cały proces legislacyjny to jeśli nawet Prezydent nie zawetuje i tak prawdopodobnie długo się nie ostaną. Choć z drugiej strony Polak potrafi (najczęściej spieprzyć), więc kto wie, na wszelki wypadek lepiej zawczasu wyrazić swój sprzeciw ;)

Zresztą dość szybko okazało się, że jednak ma sens, bo kancelaria Premiera (również obecna na Facebooku) zreflektowała się jakby i sam Premier napisał list do internautów, obiecując „jeszcze raz przyjrzeć się projektowanej ustawie”, i przede wszystkim zapowiadając spotkanie w tej sprawie z internautami właśnie.

Abstrahując od samej inicjatywy spotkania (wszystkie szczegóły na na Facebooku: zapytajPremiera oraz na blogu Maćka Budzicha, który jako zaufany przedstawieciel blogosfery jest organizatorem i koordynatorem tego spotkania; oraz ), więc nie wnikając tu w dalsze szczegóły, bym chciał się zapytać, do kogo właściwie zaadresowany jest ten list? Bo w zasadzie wiadomo, że to odpowiedź PR Premiera na szerzące się protesty, ale kto to są Internauci?

Wg badań NetTrack z października 2009 r., z internetu korzysta ponad 50% Polaków, czyli ok. 15 mln. powyżej 15 roku życia. To niewiele mniej niż wzięło udział w ostatnich wyborach parlamentarnych, a znacznie więcej niż głosowało w nich kiedykolwiek na jakąkolwiek partię polityczną!

Dlaczego nikt nie zwraca się do „czytelników gazet”, albo „słuchaczy radia”? Przecież internet to tylko medium, lepsze, inne, bardziej demokratyczne niż inne, ale medium. Nie da się zdefiniować jakiegoś przeciętnego internauty, choć takie określenie jest często używane, szczególnie w tych bardziej tradycyjnych mediach. Prawdopodobnie (a nawet na pewno) wynika to z traktowania przez stare media (choć olbrzymia ich większość też z niego korzysta) i przez osoby znaczące coś w Państwie Internetu jako śmietnika, w którym tylko porno, pedofile, hazard i naśmiewanie się z autorytetów, więc najlepiej to ograniczyć ocenzurować i zamknąć. Stąd traktowanie „Internautów” jako jakiejś mitycznej grupy, sprawującej władzę nad umysłami mało świadomego ciemnego ludu.

A przecież Internauta to ja i Ty, to wszyscy protestujący przeciw ustawie (część z powodów czysto politycznych, bo można dowalić obecnej ekipie), jak również gorąco i z całego serca go popierający, bo i takie głosy wcale nie są odosobnione.

Więc Panie Premierze, nie pisz Pan do Internautów, ale do Narodu, bo to Naród protestuje. A że akurat naród, który korzysta z internetu to w tym przypadku nie dziwi nic ;)

Creative Commons License photo credit: ervega

Lubię to! Czyli na blogu jak na Facebooku

Like It

Jednym z objawów przedawkowania fejsbuka jest kompulsywne poszukiwanie na niemal każdej możliwej stronie małego symbolu dłoni z wyciągniętym w górę kciukiem. Łapię się czasem na tym, że czytając jakąś informację w gazecie, na blogu czy choćby na Blipie, koniecznie chcę ją polubić i brak tej możliwości powoduje poważny dyskomfort. Macie tak? No, to po pierwsze możecie zastać fanami Lubię to! na Facebooku, a po drugie zainstalować sobie na blogusiu (na WordPressie) własną odmianę wyciągniętego kciuka ;)

Wtyczka WP Likes 3.0

Autor wtyczki WP Likes, Aakash Bapna wypuścił właśnie jej trzecią już wersję, kompletnie przepisana i poprawiającą wiele znalezionych błędów i niedoróbek. WP Likes umożliwia poza tym do czego natywnie służy, czyli ulubieniem postów na blogu, m.in. wyświetlanie widgetu z najbardziej ulubionymi. Wtyczkę łatwo można dostosować do istniejącej szaty graficznej bloga, modyfikacja stylu CSS nie wymaga grzebania w oddzielnych plikach, a jest dostępna na ekranie konfiguracyjnym pluginu. Tak samo łatwe jest przetłumaczenie komunikatów wtyczki. Autor deklaruje również, że wtyczka jest w pełni zgodna z wtyczką WP Super Cache, dzięki czemu nie powoduje opóźnień w wyświetlaniu „ulubień” nawet przy włączonym super cache.

Instalacja jest standardowa i sprowadza się do wgrania plików do katalogu wp-content/plugins a następnie włączeniu wtyczki i skonfigurowaniu. Można również pobrać wtyczkę automatycznie, korzystając z WordPressowego instalatora wtyczek.

konfiguracja wtyczki WP Likes

Konfiguracja jest banalna, sprowadza się do zaznaczenia kilku opcji (m.in. czy włączona jest WP Super Cache), wybrania czy Lubię to! ma być widoczne na stronie głównej, czy tylko w poszczególnych postach oraz wybrania wzoru ikonki – można umieścić własną. Wygląd można dowolnie zmieniać modyfikując styl CSS wtyczki. Domyślnie link z kciukiem znajduje się pod wpisem, ale można go umieścić w dowolnym miejscu, wywołując w odpowiednim miejscu funkcję wp_likes_render_post(). W panelu konfiguracyjnym można również przetłumaczyć komunikaty wyświetlane przez wtyczkę, wygodnie, bo bez potrzeby edytowania plików tekstowych wtyczki. Ja przetłumaczyłem sobie dokładnie w duchu spolszczenia fejsbuka.

Wtyczka jest zgodna z najnowszą wersją WordPress 2.9.1 i do poprawnego działania wymaga PHP w wersji 5.2.

I od tej pory na własnym blogu możemy cieszyć „najważniejszą” funkcjonalnością największego portalu społecznościowego ;) He, he, ale pamiętajcie, że eksperci wieszczą iż w tym roku Facebook będzie najważniejszym instrumentem komunikacji z klientami. I bardzo dobrze, bo Mafia Wars i FarmVille też czekają na nowych graczy, choć z czasem coraz trudniej ogarnąć rosnące zastępy znajomych i ulubionych stron. Więc kciuki w górę i lubimy to! wszyscy razem. Również na własnym blogasku.

Wtyczkę WP Likes można pobrać, jak wszystkie inne, z katalogu WordPressa, o tu: WP Likes 3.0. Inną, o podobnej funkcjonalności jest wtyczka I Like This, choć mi osobiście nie specjalnie się podoba, no i przede wszystkim nie ma kciuka ;) Choć ma serduszko.

A jeśli podoba Ci się wpis, to nie wahaj się i użyj kciuka ;)

Domena zielonybloger.pl is no longer valid

W zasadzie to istnieje, ale już nie jest moja. Przynajmniej przez jakiś czas, a może już nigdy ;) ten blog nie będzie dostępny pod ww. adresem.  Czytaj dalej Domena zielonybloger.pl is no longer valid