Pół internetu używa Unicode, a my co?

decode unicode poster

Według Google niemal 50% stron w internecie używa kodowania znaków w unikodzie. Dokładna liczba może być nieco inna, bo brane pod uwagę są strony indeksowane przez Google. Wykres pokazuje bardzo szybki wzrost od jakichś czterech lat, a ponieważ rozwój technologii postępuje wykładniczo, już za rok tylko margines będzie używał innego kodowania ;)

To i tak za mało, właśnie brak unikodu nie pozwala mi zamówić np. książek w Amazonie (gdzie króluje ISO-8859-1) na własne nazwisko, literka ź nijak nie chce się prześlizgnąć przez ichnie formularze ;) Nie mówiąc już o tym, że wyszukanie czegokolwiek co ma w nazwie znaczki nie występujące w Latin-1 nie jest możliwe. Z pierwszej dwudziestki najbardziej popularnych stron wg Alexy, poza chińskimi, właśnie tylko Amazon nie używa Unicode. Google, zarówno na google.com jak i na stronach w  językach lokalnych od dawna już używa unikodu, również do wyszukiwania – wszelkie informacje są najpierw konwertowane z innych stron kodowych do Unicode.

A jak jest u nas? Postanowiłem to sprawdzić. I niestety „polski” internet nie wygląda w tym porównaniu najlepiej. Pod uwagę wziąłem strony z pierwszej dwudziestki zestawienia Alexa, wspomagane wynikami Megapanelu z listopada zeszłego roku, plus własny wybór bardziej znanych witryn. Nie jestem w stanie policzyć jak to wygląda wg zasięgu, czy ilości stron, ale już na pierwszy rzut oka widać, że większość stron i największych portali unikodu nie używa.

Polskie strony używające Unicode

początkowa kolejność wg Alexa, potem wg własnego uznania ;)

  • Nasza klasa
  • Allegro
  • Demotywatory
  • O2 (ale już należący do nich Pudelek nie)
  • Wrzuta
  • FilmWeb
  • OtoMoto
  • Panorama Firm
  • Ceneo
  • Wykop
  • Blip
  • empik.com

również lokalne Google, Microsoft, Apple, Facebook, YouTube, Wikipedia itp.

A teraz niechlubna ;) lista polskich stron nie używających Unicode

Portale, serwisy społecznościowe itp.

  • Onet
  • Wirtualna polska
  • Interia
  • Gazeta.pl
  • Money.pl
  • Grono

Banki internetowe

  • PKO BP (również Inteligo)
  • Citi Handlowy
  • Bank BPH
  • Millenium
  • Alior Bank
  • Kredyt Bank – tu kuriozum, jedyna większa strona, jaką znalazłem, używająca kodowania Windows-1250! Strony banku internetowego mają już na szczęście ISO 8859-2, ale strony informacyjne CP-1250.

Sklepy, porównywarki itp.

  • merlin
  • agito.pl
  • skąpiec

Jak widać ta lista jest dość obszerna. W przypadku portali informacyjnych kodowanie ma może mniejsze znaczenie, znaki spoza zakresu można zawsze przedstawić za pomocą encji, ale już wyszukiwanie niestety jest znacznie utrudnione. Bankom też to w sumie nie przeszkadza, choć powinny być raczej bardziej innowacyjne. Natomiast już w przypadku sklepów, szczególnie oferujących artykuły z obcojęzycznymi nazwami/tytułami, a także porównywarek cen brak Unicode jest poważnym naruszeniem użyteczności, utrudniając, lub wręcz uniemożliwiając wyszukanie nazw zawierających obce znaki spoza zakresu.

A blogi?

Tu jest różnie. Bloger jak całe Google ma Unicode, podobnie WordPress.com, jak również blogi na własnym hostingu napędzane WordPressem – już od dawna domyślnym kodowanie zarówno w bazy jak i zaplecza bloga jest Unicode. Niektóre starsze instalacje, szczególnie na niepewnych hostingach mogą czasem być w innym kodowaniu.

Należący do Agory blox, jak cała reszta niestety ma kodowanie ISO 8859-2, to samo blogi na Onecie i (też onetowy) Blog.pl.  Zaawansowany edytor bloxa pozwala na używanie dowolnych znaków, również spoza ISO, wstawiając je właśnie jako encje, ale spróbujcie potem wyszukać jakiś egzotyczny tekst w jeszcze bardziej egzotycznym języku ;) Jogger i Salon24 używają Unicode.

Na szczęście już prawie nikt nie używa CP-1250, co jeszcze kilka lat temu było przekleństwem, szczególnie Usenetu, bo przeglądarki internetowe zawsze sobie z tym radziły, pod warunkiem zadeklarowania kodowania zgodnie z naprawdę użytym.

Blog Backup Day

Blog Backup day logoBył już Blog Day, był Blog Action Day, teraz czas Blog Backup Day.

Pomysł pierwotnie rzucony ponad rok temu, 13 października (w dodatku to był piątek, a każdy wie, że w piątki trzynastego wszystko się może zdarzyć i nie muszą to być zdarzenia zaliczane do najprzyjemniejszych w życiu) przez mojego imiennika z BloggerDesign, a podchwycony następnie przez Blog Tutorials, polegający na ogłoszeniu 13 każdego miesiąca nieoficjalnym dniem robienia kopii zapasowych bloga. Po angielsku to niestety lepiej (bo krócej) brzmi: unofficial blog backup day.

Inicjatywa w sumie ciekawa, bo służąca poprawie bezpieczeństwa: wykształceniu nawyku systematycznego zabezpieczania nie tylko bloga ale w ogóle wszelkich danych, mogących bezpowrotnie zniknąć w czeluściach bezdusznych maszyn, działających w myśl praw Murphy’ego. Warto ją przypomnieć (bo jakoś ostatnio o niej cicho), niby to rzeczy oczywiste, ale zazwyczaj przypominamy sobie nich za późno, a strata tworzonego przez parę lat bloga może być bardzo bolesna.

Dzień 13 każdego miesiąca jest datą jedynie symboliczną, częstotliwość backupu zależy od ilości wpisów, jeśli publikujesz 1 post tygodniowo, taki okres będzie wystarczający, na blogach których autorzy produkują kilka wpisów dziennie i zbierają pod każdym dziesiątki komentarzy kopia powinna być wykonywana codziennie, a nawet częściej.

Oprócz wpisów i komentarzy, które są esencją każdego bloga, warto również zabezpieczyć pliki odpowiadające za wygląd bloga. Pisałem o tym w kontekście bezpieczeństwa bloga kilka miesięcy temu, opisując szczegółowo sposoby wykonania kopii blogów opartych na WordPressie. Do tego celu zresztą najlepiej zaprząc jedną z istniejących wtyczek, które same w odpowiednim momencie wykonają za nas całą żmudną pracę. Osobiście używam WordPress Database Backup, pozwalający wykonać backup na żądanie lub w zadanych przedziałach czasu (co godzinę, codziennie lub co tydzień). Kopiowane są wszystkie standardowe tabele z bazy WordPressa, można dołączyć również inne tabele (np. tworzone przez pluginy, lub własnoręcznie) z tejże bazy. Kopia może być pozostawiona na serwerze do późniejszego pobrania, lub automatycznie wysłana na zdefiniowany email.

Blogi hostowane na platformach takich jak blox czy Blogger nie mają wbudowanej funkcjonalności wykonywania kopii zapasowych wpisów i komentarzy, te sprawy załatwiane są systemowo przez dostawcę i raczej nie słychać o stratach z powodu zaniedbań operatora bloga. Natomiast przykre w skutkach mogą być własne błędy blogera (jak np. przypadkowe usunięcie postów, czy całego bloga). W takich przypadkach nie zawsze można liczyć na życzliwość operatora. Warto więc stosować metody „chałupnicze” i mieć kopie każdego posta na dysku własnego komputera. Warto również (a nawet trzeba) wykonać kopie wykorzystywanego na blogu szablonu – na Bloggerze i na bloxie jest to po prostu jeden plik, który łatwo można zapisać na dysku. W pomocy Bloggera znalazłem jeszcze jeden sposób na wykonanie kopii całego bloga, ale jest on raczej mało elegancki i przy częstszych wykonywaniach dość pracochłonny.

A więc na co jeszcze czekasz? Zabezpiecz swój blog teraz!

A tak na marginesie, znacie jeszcze jakieś blogowe dni? Takie które można by wspólnie obchodzić i razem pogłębiać informacyjny szum na blogach?

WordPress 2.3.1 już za chwilę

Miesiąc po wydaniu wersji 2.3 prawie gotowa jest kolejna wersja WordPressa, oznaczona numerem 2.3.1 – Boren pisze, że jeśli nie wydarzy się nic nieoczekiwanego, będzie dostępna jeszcze w tym tygodniu, a już teraz można pobrać i zainstalować RC1.

Jest to wersja poprawiająca błędy (ponad 20) znalezione już po wydaniu wersji 2.3. Wśród ważniejszych poprawek znalazło się m.in. wsparcie dla tagów dla Windows Live Writera (microsoftowego edytora blogów WYSIWYG, mającego również polską wersję językową i współpracującego poprawnie nie tylko w blogami na WordPressie, ale również m.in. na blox.pl).

Wydanie kolejnej głównej wersji 2.4 planowane jest jeszcze w grudniu tego roku.

Aktualizacja 27 października o godz. 1:15:

Jest już oficjalna wersja 2.3.1 – od Release Candidate 1 różni się dokładnie 4 bajtami w jednym pliku:version.php. Zgadliście, różni się po prostu numerem wersji, więc jeśli ktoś już uaktualnił swojego bloga (tak jak ja to zrobiłem wczoraj) do wersji RC1 nie musi robić nic. Ewentualnie podmienić ww. plik, lub tylko wyedytować w nim numer wersji ;)

Jak już pisałem wersja ta poprawia tylko kilka zauważonych wcześniej błędów, w tym poważne, wpływające na bezpieczeństwo (szczegóły jak zwykle na oficjalnym blogu WP). Aktualizacja jest więc szczególnie wskazana.

Blogfrog oceni blogosferę?

W czwartek zobaczyliśmy nową odsłonę polskiego odpowiednika Technorati (a przynajmniej aspirującego do tego miana), reanimowanego przez Agorę Blogfroga. Faktycznie to niektórzy widzieli go już trochę wcześniej, byli nawet tacy, co już miesiąc temu wiedzieli, że to właśnie gazeta.pl pod swe skrzydła blogową żabkę przygarnęła ;)

Kolorki serwis ma różnorakie i bardzo intensywne (trochę bije po oczach, ale w sumie mi się podoba), dominujący jest zielony (również w logo) więc czuję się niejako w obowiązku napisać o nim kilka słów ;)

blogfrog.pl

Blogfrog w nowej odsłonie chce być czymś więcej niż tylko zwykłym agregatorem blogowych wpisów. Chce zgromadzić, jak głosi jego motto: najlepsze blogi w jednym miejscu. W celu wybrania tych najlepszych opracowany został specjalny algorytm wyliczający frogrank. Działanie algorytmu jest równie tajne i niezbadane jak googlowego pagerank ;) Wiadomo, że pod uwagę brane są nie tylko oceny czytelników, ale również ilość (i pewnie jakość) linków przychodzących, ruch z samego Blogfroga, tudzież wiek bloga – tu jak wino, im starszy tym lepszy (szkoda, że nie wiek autora, tu miałbym duże szanse ;).

Polski Technorati?

Blogfrog ewidentnie idzie w ślady Technorati – jak przyznaje tebe, to bliskie ich (znaczy Agory twórców Blogfroga) sposobowi myślenia – a nawet wyprzedza: Technorati publikuje cykliczne raporty o stanie światowej blogosfery, a Agora swój pierwszy raport z badania polskiej blogo- (czy bloXo-) sfery ujawniła już w przeddzień oficjalnej odsłony nowego blogfroga ;) Komunikat prasowy Agory mówi że Blogfrog zna „aż” tysiąc trzysta blogów (do dziś jest ich już zapewne trochę więcej), przy jakichś około 90 milionach o których słyszało Technorati, więc znaj proporcją mocium panie, w dodatku większość z tych znanych przez froga to bloxy, ale gazeta zauważyła już że, o dziwo, jest cała masa pasjonujących blogów poza Bloxem ;)

Raport o stanie blogosfery

Raport, a właściwie wyniki największego jak dotąd badania polskiej blogosfery, które przedstawiono we wtorek, były bardzo bloxocentryczne, czego nawet nikt nie ukrywał, ale w takiej sytuacji nazywanie tego badaniem polskiej blogosfery jest wg mnie lekkim nadużyciem, przynajmniej semantycznym ;)

Tak na marginesie: dużą, bardzo dużą wagę badający przykładali do linków prowadzących do blogów, szczególnie linków w blogrollach. Nie negując wagi linków przychodzących, uważam że jednak większą wagę mają pingi i trackbacki powołujące się na konkretny wpis na blogu, bo wystarczy zajrzeć do niektórych blogrolli na bloxie i nie tylko – joggerowe blogi (nie śmiem ich nazwać zarezerwowaną dla onetowych nazwą blogaski, choć wiele z nich takie przypomina) aż roją się od blogrolli odsyłających do takich samych, często-gęsto składających się raptem z kilkuwyrazowych, jedno- dwu zdaniowych notek. I proszę mnie tu natychmiast nie odsądzać od czci i wiary – ja nie generalizuję!

Ciekawe jak wyglądałoby badanie onetowej blogosfery. Czy główną miarą popularności byłyby komcie? ;)

W polskiej blogosferze brakowało brakowało takiego miernika jakości. Może są tacy co im nie brakowało, oczywiście szanujemy ich ;) Dobrze, że w serwis zainwestowała duża i znana (i zasobna ;) marka – to daje duże możliwości rozwoju i osobiście mam nadzieję, że blogfrog nie pójdzie w ślady gwaru, szczególnie, że na tym polu w kraju nie jak dotąd ma żadnej konkurencji.

Czy to jeszcze beta?

Tylko koniecznie musi dopracować narzędzia promocji – starałem się na kilku blogach umieścić przycisk głosowania (ściśle wg instrukcji, potem mniej ściśle). Nie da się. Czyżbym coś robił źle? Chyba nie, bo jeszcze na żadnym blogu tego nie widziałem, a i reuptake sugeruje że nawet na bloxach nie działa. Udało sie komuś? Może po prostu instrukcja coś pomija? Tak czy inaczej – do poprawki. No i dlaczego nie ma żadnej faviconki? Czy mam zasugerować pomoc? ;)

Działa natomiast przycisk „jestem w blogfrog”.
O! Mam frogrank 4. Przyznam, że sam sobie oceniłem kilka postów ;) – skoro ranking nie polega wyłącznie wyłącznie na ocenie przez odwiedzających, więc mam nadzieję, że jakoś mocno nie zaburzyłem oceny popularności tego bloga. Gdyby tak było, to zbyt łatwo dałoby sie manipulować oceną.

A czy Wasze blogi są w blogfrogu?

Gdzie pisać bloga

Istnieje wiele rozwiązań, gotowych platform blogowych i wybór jednej z nich może naprawdę przyprawić o zawrót głowy. Nie chcę tu sugerować konkretnego wyboru, choć na końcu przedstawię moje propozycje, gdyż wybór zależy od wielu czynników, które chcę tu pokrótce opisać.

Przed wyborem swojej platformy do pisania bloga, warto chwilę się zastanowić. Jest to ważna decyzja i nie warto podejmować jej zbyt pochopnie. Oczywiście zawsze można zmienić już raz wybraną platformę na inną, ale zawsze będzie wiązać się to z dodatkowymi kosztami (niekoniecznie w wymiarze ściśle finansowym), a na pewno będzie to wymagało dodatkowej pracy lub przynajmniej oczekiwania na uaktualnienie danych w wyszukiwarkach internetowych w przypadku zmiany domeny naszego bloga.
różne platformy blogowe
Wybór zależy od kilku (przynajmniej kilku, zapewne jest ich więcej, ja wymienie kilka najważniejszych wg mnie) czynników:

  1. Czy ma to być blog zupełnie prywatny, opisujący tylko jakiś wycinek naszego życia, czy też bardziej profesjonalny, nastawiony na szersze grono czytelników? – tu trzeba wziąć pod uwagę kilka kwestii: jak duży ruch będzie generował nasz blog, jakie dodatkowe opcje (np. statystyki odwiedzin) będą nam potrzebne, itp.
  2. Czy mamy zamiar (od razu lub w przyszłości) spróbować zarobić na swoim blogu i umieścić na nim reklamy? – niektóre serwisy blogowe mogą wyświetlać własne reklamy, lub zakazywać umieszczania reklam.
  3. Jak bardzo jesteśmy zaawansowani technicznie (język HTML, style, itp)? – niektóre platformy wymagają pewnej wiedzy, inne są łatwe do uruchomienia nawet dla laików komputerowych.
  4. Jakimi funduszami dysponujemy i ile pieniędzy możemy przeznaczyć na uruchomienie i utrzymanie bloga? – są opcje zupełnie bezpłatne, są też inne wymagające zainwestowania różnych kwot.
  5. Warto też dowiedzieć się, gdzie blogują inni – można spytać przyjaciół, znajomych, dzielących wspólne zainteresowania, gdzie prowadzą swojego bloga – na starcie pomoc kogoś znającego już to narzędzie może być nieoceniona w przypadku gdy nie mamy żadnego doświadczenia.
    Tu aż prosi się o zorganizowanie ankiety na temat miejsca pisania bloga przez czytelników, ale obawiam się, że mój blog ma jeszcze zbyt mały zasięg, więc wyniki nie byłyby miarodajne. Może np. Polski blogger (jeśli Fanatyk to przeczyta) podjąłby się tego zadania? Zapraszam ;)

Update: zdecydowałem się jednak sam na przeprowadzenie ankiety. Zapraszam do wzięcia udziału.
Czytaj dalej Gdzie pisać bloga