Google+

Saturday, October 11, 2008

Это случилось - гугл статистика Вики-сайтов на лету

Есть вещи, которые вызывают у меня восхищение и заставляют почувствовать себя иммигрантом цифрового мира. Один из примеров - живые данные. Скорее всего, молодое поколение этим не удивишь. Конечно, живые данные - а какие же еще? А для меня в этом что-то магическое. Короче - столбики данных, которые вы видите в этом сообщении, подвижные, живые и меняются по мере того как меняются данные региональных медиавики.

Как это делается?
Я начинал об этом писать 20 июля - про динамическую статистику вики сайтов
Первая прелесть в том, что медиавики отдает в открытый доступ свою статистику. И если мы обратимся к конкретной вики с вопросам - "Ну и какая твоя статистика - http://letopisi.ru/index.php/Special:Statistics?action=raw, то она нам все про себя расскажет. Например, на 11.49 14.10.2008 выдала цифирки:
total=97324;good=31237;views=11496608;edits=390177;users=20886;admins=77;images=38200;jobs=3
а через пару секунд
total=97325;good=31237;views=11496718;edits=390182;users=20886;admins=77;images=38200;jobs=3
т.е. все изменения в этой статистике отражаются.

Вторая прелесть в том, что таблицы Google могут всасывать в себя данные из внешних источников. Т.е. я могу в ячейке таблицы указать не цифру, а источник - откуда ее забрать:
=ImportData("http://letopisi.ru/index.php/Special:Statistics?action=raw")
И у меня в ячейке оказывается кучка цифр.
Дальше я пойти не смог, поскольку не сумел разобраться. Мне нужен был какой-нибудб оператор типа split, чтобы эту строку порезать на кусочки. А я плохо разбираюсь в таблицах и отношусь к ним с недоверием.
31 июля Олег Самусенко в родственном блоке написал про живую обработку данных и мы вступили в очень тягучую переписку - как оно бы должно работать. И 9 октября он мне бросил пример - так есть же split в GoogleDocs!
Дальше все просто:
Мы получаем данные в ячейку - например, в B2
В другой ячейке мы просим - порежь нам В2 на кусочки через точку с запятой =SPLIT(B2, ";")
И потом каждый из полученных кусочков мы еще режем пополам через знак= =SPLIT(D2,"=")

На все это безобразие можно посмотреть в табличке http://spreadsheets.google.com/pub?key=pQ7RVZh28cQdH_VlM-tQ5LQ
Пока все это выглядит плохо, поскольку с таблицами я работать не умею. Особенно это относится сбору и представлению данных. Надо бы города написать в одном столбике, а все данные в строках напротив этого города. Но и то, что есть очень радует.
Да спрашивают - а как же статистика самой Летописи, чего ее тут нет? А просто она все остальных на порядок забивает и я ее из этих графиков убрал. Полную статистику на 14 октября можно посмотреть в АстроВики - статья http://www.nnspu.ru:8080/wiki/index.php/Статистика_в_российских_учебных_медиавики

Жду предложений - как нам правильно обустроить статистику и что мы можем еще посчитать живьем ?