?

Log in

No account? Create an account

Entries by category: общество

РПЦ vs гей-парад

Сравните явление «байкеры за РПЦ» и разнузданный гей-парад в Сан-Франциско (http://www.dykesonbikes.org).

... с многобайтовыми кодировками, тот пусть попытается представить букву «д́» (с диакритикой) одним Unicode код-поинтом.

Я уже замучался говорить народу, что ничего нет лучше UTF-8. Для представления человекочитаемого символа что в UTF-16, что в UCS-4 ("UTF-32"), что в UTF-8 может потребоваться несколько комбинаций байт (8 и больше байт в UCS-4!). Это родовая болезнь Unicode, которая делает использование UTF-8 гораздо более правильным и привлекательным, чем все остальные кодировки.

Никогда с юникодом не будет $str[n]="A" правильно работать (заменять произвольный символ на «A») за гарантированную (не amortized) константу времени. Но все пытаются эти грабли непременно пошевелить.

Tags:

Люди в Echo

Мы в Echo постоянно вывешиваем открытые вакансии. Хотя из-за медленноватости самого процесса найма (отвлекаем инженеров от работы!) новые люди умощняют наш коллектив далеко не каждую неделю. Может быть, даже реже, чем раз в пару месяцев получается.

Это даёт основание некоторым несознательным товарищам сомневаться в том, что мы кого-либо нанимаем вообще. Мол, вывесили вакансии просто так, и прикалываются над всеми, кто пишет на jobs@aboutecho.com. Хочу написать о людях, которых мы наняли прошедшей осенью. Разумеется, это непременно поставит крест на всех инсинуациях по поводу наших практик найма сотрудников.

В декабре 2011 к нам присоединился Евгений Тарасов из Екатеринбурга.

Евгений Тарасов — уральский сисадмин и специалист широкого профиля. Как и все выпускники УГТУ-УПИ. За время профессиональной деятельности ему довелось реанимировать и развивать хостинг, ускорять и повышать юзабилити САПР и автоматизировать тестирование специализированного дистрибутива Linux. Вот теперь и облачный сервис. Любит писать на хаскеле, кататься на коньках и играть в ежебол.


Чуть ранее, в октябре, мы встречали с поезда Никиту Прокопова.

Никита Прокопов — биполярный сибирский программист на языках программирования, выпускник Факультета информационных технологий Новосибирского государственного университета. За свою карьеру успешно разочаровался в Джаве, в айти-моде и в компьютерах; очаровался самообразованием, проектированием пользовательских интерфейсов, русским языком и простотой как отсутствием составных частей. Выступал на АйТи конференциях в Новосибирске и Питере, ведет блог для программистов про программы со стороны пользователя. Из всех достоинств кода предпочитает наличие смысла. Приехал в Ульяновск в конце 2011-го года за работой в Echo, а на работу в Echo за плодотворным трудом и атмосферой стартапа.

Блогhttp://tonsky.livejournal.com/
LinkedInhttp://www.linkedin.com/in/prokopov

Никита недавно написал пост по мотивам первых месяцев работы в Echo: http://tonsky.livejournal.com/251485.html




Это я к чему написал? Нам очень нравится работать в компании умных и эффективных коллег. Сейчас мы хотим познакомиться ещё и со специалистом по базам данных (DBA), который будет заниматься базами данных и масштабировать базы данных. Мы планируем резко расширить наше использование баз данных (хороших и разных). Но специалист требуется преимущественно на PostgreSQL. Нужны навыки от умения понять нетривиальную схему (и умения её упростить) до конфигурирования шардинга/партиционирования. Умение работать непосредственно с железом не требуется, и так весь хостинг в Калифорнии. Важно: необходимо будет переехать в Ульяновск.

Другие наши вакансии: http://hh.ru/employer/786133

Tags:

Crazy horses

На выходе из магазина oleyka прихватила журнал, выглядящий как реклама спортивных мероприятий в Долине.

Едем домой, Ольга читает журнал и периодически зачитывает мне выдержки.
— ...а вот тут ещё ралли. Эндуранс. Сто миль. Там на лошадях ездили.
— Эндуранс? Где ездить?
— По горам. Бежишь с горы, а потом ещё плыть нужно, речка там у них.
— И что, сто километров все едут?
— Сто миль. По горам. И не едут а бегут. У женщин рекорд — 17 часов.
— В смысле, «бегут»? На лошадях бегут?
— Нет, бегом бегут. По горам. Там перепад высот — сорок одна тысяча миль.
— Каких миль?!
— Ой, нет, футов. Сорок одна тысяча футов. Двенадцать тысяч метров у них суммарный перепад высот.
— И что, все бегут сами, лошадей нет?
— Да. Пишут, что треть участников недобегают. А вообще читаю: сначала этот путь делали на лошади, скачки такие, а потом у одного чувака была лошадь дурная, и она всегда останавливалась. И он однажды сказал: «ну и хрен с ней, с лошадью, я сам побегу». И побежал!
— Какой-то ужас. Народ полжизни тренируется марафон бегать, а тут — сто миль по горам, да через реку...
— А вот ещё: «акватлон»!
— Олька, судя по этому журналу, акватлон — это народ в бадминтон играет под водой, в валенках и с гирями...
— ...да, что-то в этом роде. А вот ещё Death Ride, велосипедный. Даже картинка есть!
— Дай взглянуть?
— На!..
Картинка про Death Ride :-OCollapse )

Echo и Коровий Кликер

В 2006 году я сделал эксперимент вокруг UGC (User Generated Content) — предложил хозяевам контента размещать у себя виджет, в котором можно было делать комментарии. Да, этот пост про Echo — бывший JS-Kit.

В изначальном варианте JS-Kit было сделано предположение, что анонимные комментарии сделают этот продукт привлекательным для конечных пользователей. Анонимность, или отсутствие искусственного барьера в виде необходимости преодоления нескольких экранов регистрации, очевидно должна была влиять на количество людей, которые найдут в себе силы оторвать свои пальцы от чашки кофе и настучать какой-то контент в форму.

Чуть абстрагируясь от комментариев и влияния анонимности на движуху в них, вокруг UGC можно сформулировать следующий тезис: снижение когнитивного барьера к участию в акте UGC повышает количество участников.

Этот тезис интуитивно приятен, но без объективных данных есть повод к недоверию. А что если он не верен? Ведь социальные сети типа LJ, FB, Habr все были или остаются не просто закрытыми от анонимного комментирования, а иногда даже закрытыми от простой регистрации — сети стартовали или продолжают пользоваться системой приглашений. Приглашения (ранний LJ, Habr) и обязательные регистрации (FB) повышают барьеры на участие в дискуссиях, и этим сетям эти барьеры совершенно не мешают. На этих и других примерах, в том числе примерах закрытых клубов из реальной жизни, известно, что динамика UGC зависит от наличия каких-либо (административных, политических) барьеров к вхождению совершенно другим образом.

Но я не о сетях и клубах сейчас, а о влиянии простейших барьеров на возможность пользователю поучаствовать в создании контента в той среде, куда пользователь уже допущен. Предположим, что пользователь уже на сайте, уже член клуба, уже пришёл на тот или иной блог, в том числе по какому-либо приглашению. Выполняется ли вышеуказанный тезис?

Наши данные показывают, что да, выполняется. Причём, не просто для комментариев. За 2007 год нашей уже компанией были выпущены сначала виджет рейтингов (это такие звёздочки , по которым можно клацать мышкой), а затем виджет опросов (Polls). Соответственно, у нас было несколько разных способов генерации UGC, чтобы проверить тезис о том, что снижение барьера увеличивает участие пользователей.

Оказалось, что пользователи пользуются рейтингами (то есть, нажимают на звёздочки) чаще, чем комментируют. Этого следовало ожидать, согласно тезису. И так же логично было увидеть, что в опросах (поллах) пользователи участвуют менее интенсивно, чем нажимают на звёздочки рейтингов.

Ещё интересно, что количество блоггеров, которые установили у себя опросники, было как минимум на порядок меньше, чем тех, кто установил комментарии, а также на два порядка меньше, чем тех, кто установил рейтинговые звёздочки. Оказалось, что не только конечные пользователи, но и блоггеры подтверждают тезис о влиянии барьеров на участие: барьер установки поллов состоит в том, что опросники, в отличие от форм комментирования, нужно готовить: придумывать вопросы, варианты ответов, цветовые схемы, etc.
СервисБарьер для пользователяПопулярность у пользователейПопулярность у блоггеровБарьер для блоггеров
RatingsЩёлк!100x100xНизкий
PollsВыбрал-Щёлк!10x10xВысокий
CommentsФормулировка мысли...1x50xСредний

Интересно, что уровень интеракции (количество актов записи на акт чтения) в формах с лёгким барьером ниже (99% reads for ratings vs. 98% reads for comments, или около того). Скорее всего это связано с тем, что система комментариев на странице, как правило, одна, а рейтинговых звёздочек иногда бывает много — под каждым продуктом на странице. Получается, что пользователь видит больше возможностей для фидбека, чем имеет желания этот фидбэк осуществлять. А может и ещё с чем-то связано, мы глубоко не анализировали.

Ещё один интересный фактор состоит в том, что люди признаются, что любят формы интеракции с тяжёлыми барьерами больше, чем с лёгкими. Так, по нашему опросу Comments является более популярным продуктом, чем Polls, а Polls более популярным, чем Ratings. То есть, люди любят то, с чем сложнее справиться, и степень любви обратно пропорциональна количеству реальных пользователей продукта. Ведь рейтингами пользовались на два порядка больше, чем комментариями, и на порядок больше, чем опросниками, как видно из таблицы выше. Является ли это проявлением Стокгольмского синдрома? Может быть, щёлкание на звёздочки рейтингов оставляет меньший эмоциональный отпечаток на человеке, чем составление вдумчивого комментария?

Как можно использовать вышеупомянутые данные на практике? Повышайте барьеры чтобы ваш продукт любили (те, кто эти барьеры преодолел), понижайте барьеры, чтобы ваш продукт использовало большее количество пользователей. Видимо, какой-то подобной стратегией воспользовался Ян Богост, создавший идиотскую игру для FaceBook: Cow Clicker.
На данный момент в игре Cow Clicker насчитывается 14188 активных пользователей, рейтинг 4,5 из 5.

Каждый игрок получает корову и должен кликать по ней мышкой каждые шесть часов. Чтобы получить право кликать чаще, можно купить дополнительные кредиты за деньги.

http://habrahabr.ru/blogs/facebook/100206/

Смысл, как я понимаю, в том, чтобы создать совершенно тривиальный барьер для игры — не надо учить правила и запоминать стратегии. Кликай да кликай по коровам. Похоже на тетрис чем-то: гораздо более популярная игра, чем WoW или NFS, требующие каких-никаких скиллов.

Сайд-эффектом низкого барьера вхождения является монетизируемость: оказалось, что монетизировать рейтинги, несмотря на их бешеную популярность у пользователей и блоггеров, гораздо сложнее (интегрально, уж не говоря об удельном), чем монетизировать комментарии. Поэтому мы в итоге отказались от рейтингов и опросников, как от бесперспективных площадок для монетизации.

Короче, ничего не понятно, пойду чая выпью.

Tags:

Выступил с телеконференц-докладом на МаргинКон'2010. Организованная Юрием Юревичем в Омске конференция по «маргинальным языкам» рисковала оказаться с четырьмя докладами на сто человек, если бы не своевременная наводка levgem попробовать пригласить кого-нибудь сделать доклад через Skype. Получилось завербовать alexott с докладом о Clojure и меня.

http://habrahabr.ru/blogs/erlang/97610/

Интуитивно (то есть, после прочтения kapterev, Presentation Zen и прекрасных работ Тафти) было понятно, что конференция будет состоять из докладов «вот язык, вот его фичи», и быть последним в этом списке означало дорезать нервы молодых людей (и девушек), которые за целый день должны были от этого формата, да по жаре, опухнуть.


Рис. 1: Щёлкните для получения слайдов, PDF.
В качестве внесения разнообразия в предсказуемый ход узкотехнической конференции, я решил впервые публично озвучить некоторые причины того, почему мы (Echo, JS-Kit) разрабатываем на Erlang + OCaml. Надежда была на то, что после кучи кода, увиденного аудиторией, доклад с человеческими словами и без единой строчки кода будет восприниматься легко и станет своего рода развлечением. Так и получилось, но об этом чуть позже.

Делать доклад через Skype забавно. С одной стороны, сидишь себе в трусах в «бункере под Сан-Франциско», пьёшь чай и рассказываешь без особого напряжения. С другой стороны, смотришь на усталых и голодных программистов, изнывающих от жары и предыдущих докладчиков уже часов шесть, и из-за проблем с разрешением видео не видишь тонких эмоций людей. То есть, маловато человеческого фидбэка, хотя всё повеселее, чем видео записывать «в никуда».

Разбор по костямCollapse )
... то уже поздняк метаться. Через три часа выезжаю.

Вечером был на AmBAR митинге с несколькими из венчурных инвесторов, которые ездили в Россию смотреть на развалины Сколково, Чубайса, Вексельберга, и слушать Медведева. Было весело. Видео там снимали, поэтому пересказывать подробно смысла нет.

Несвязанные зарисовки с митинга (пока по памяти, потом поправлю, как видео выйдет)



Дама задаёт вопрос висЯм:
— Вы не встречались с Академией Наук? [Нет...] Так вы что, только из-за денег туда ездили?!

Jim Smith, (Mohr Davidow Ventures):
— Мы предпочитаем вкладываться в IT. Life sciences в России отстают на несколько лет от уровня продуктизации и готовности к глобализации, которую мы видим в российском IT.

Mark Iwanowski, (Trident Capital):
— Эта инициатива российского правительства должна привести к поощрению предпринимательского духа, чтобы народ шёл не на государственные должности зарабатывать деньги, а имел альтернативы в коммерческом секторе. Это, надеемся, приведёт и к сокращению государственного аппарата (раскатистый смех и шквал аплодисментов в зале).

Tags:

Adam Silberstein, Jeff Terrace, Brian F. Cooper, Raghu Ramakrishnan

http://www.google.com/search?q=pdf+selectively+materializing+user%27s+event+feeds

Feeding Frenzy: Selectively Materializing Users’ Event Feeds


Народ из Yahoo! Research и Princeton University разбирает проблему глобальной оптимизации расходования машинных ресурсов для поддержки передачи реал-таймовых фидов.

Существуют поставщики фидов (те, кто пишет твиты, например, или RSS провайдеры) и есть потребители фидов (аггрегаторы, странички на фейсбуке, поисковые интерфейсы). Каждый потребитель может быть подписан на неограниченное количество поставщиков фидов. Поставщики могут поставлять фиды в реал-тайме (чтобы ембедщики не смеялись под влиянием своей профдеформации, сразу пишу, что вебовый реалтайм — это человеческий реал-тайм: секунды и десятки секунд задержек между отправкой и получения сообщения считается «реальным временем» в современном вебеlionet), а потребители — в реал-тайме же хотят его потреблять. А могут и не поставлять, и, соответственно, не хотеть. Наивно полагать, что в каждом случае, когда потребитель хочет посмотреть на свой фид (френдленту, например), мы должны шерстить базу поставщиков и формировать фид: существуют механизмы кеширования, материализации фидов. Это позволяет потребителям получать уже кешированный фид, практически мгновенно (из кэша).

Теперь проблема: если есть быстрые поставщики фидов и огромное количество не очень часто посещающих свои фиды потребителей, то материализация фидов для такой толпы становится накладной операцией. Например, в твиттере есть такой пользователь «Ashton Kutcher», каждое сообщение которого расходится по «френдлентам» почти пяти миллионов подписчиков. То есть, каждое сообщение от него должно повлиять на миллионы материализованных представлений.

Статья обсуждает следующее решение: что если мы можем выбирать, использовать ли для фида материализованное представление, или нет (идти в сторадж более низкого уровня), базируясь [только] на свойствах пары поставщик/потребитель? По сравнению с другими статьями на эту тему, данная статья демонстрирует, что принятие решения о материализации не может быть принято только на основании свойств поставщика (частоты обновлений, например). Авторы разрабатывают механизм вычисления необходимости материализовывать фид исходя, одновременно, из отношений скорости генерации событий и и частоты их потребления.

Ключевой результат таков: авторы показали, что принятие решений исходя из локальных соображений (свойств поставщика и потребителя) приводит к глобальной оптимизации производительности в целом всей системы поддержки графа передачи информации от поставщиков к потребителям. Авторы демонстрируют это, в частности, экспериментами над своей реальной системой такого рода, которую они разрабатывают и поддерживают в Yahoo.

Авторы вводят понятие k,t-diversity. Неформально это можно понимать так: если приходит событие от Боба в последние t квантов времени, тогда мы не показываем более k событий от Алисы, ежели мы не показываем в это же время событие от Боба.

Рассматриваются две модели когерентности: per-producer и global (эта деталь неважна сейчасlionet). В модели per-producer, стоимость события для конкретного потребителя зависит от частоты актов потребления (рефреша страницы френдленты) и событий поставщика. В глобальной модели когерентности, стоимость события зависит от частоты актов потребления и суммы частоты событий от всех поставщиков событий для данного потребителя.

Что такое стоимость — это выраженная в CPU или в disk IO операциях сложность обслуживания события для системы.

Адаптивный алгоритм, который они предлагают ("правильный" knapsack алгоритм — NP-hard) выглядит примерно так:

We simply sort the pull edges by descending, and shift some number of top-ranked edges to push. Then, if our latency is higher than the SLA, we incrementally shift the top-ranked pull edges to push. If our latency is lower than the SLA, we incrementally shift the lowest-ranked push edges back to pull (note that we never shift edges to pull if they are assigned to push).


От себя:

В этой области всё интуитивно понятно было как оптимизировать и без статьи, но хорошо, что кто-то пошёл и чуть более формально отнёсся к проблеме. Опять же, экспериментальная проверка добавляет уровня доверия результатам статьи. Для эховцев будет небезынтересно поверхностно ознакомиться с параграфами начиная с 4.1 Architecture, в которых рассказывается, как конкретно делается система материализованных представлений на яховской PNUTS.

Tags:

Утренник

Сегодня в нашем образовательном учреждении состоялась пресс-конференция, посвящённая восьмому марта.

Материалы пресс-конференцииCollapse )

У tulp.ru есть все шансы

Вот некоторые не без причины ёрничают по поводу того, что, мол, сложно в России заниматься технологиями. И приводят слова Воложа:
Я вижу как минимум три очень активных области. Это приложения на трех платформах: на социальных сетях и их графах, на картографической основе с геопривязкой и еще в мобильном вебе. Как грибы появляются команды, которые придумывают приложения на этих платформах и на их пересечениях. И мгновенно становятся миллионерами.

http://www.kommersant.ru/doc.aspx?DocsID=1326654&ThemesID=374

Приводят слова и ёрничают. Ёрничают и приводят. Только вот некоторые ещё берут на себя смелость приехать из Калифорнии в Россию, и начать делать именно что "на социальных сетях, на картографической основе с геопривязкой". Встречайте стелс-стартап tulp.ru (аналог популярного ресурса Yelp в штатах). Это бета, а скорее даже technology preview. Но всё очень серьёзно. Стартап, сделанный девушкой (kudashkina, tulp_ru), которая ещё пару-тройку месяцев назад разбиралась с инвестициями, командой программистов и договорами с ГИС-провайдерами, а сейчас, спустя пару дней после релиза, имеет 27 зарегистрированных пользователей.

Можете начинать ёрничать уже. Но я лично считаю более важным держать руку на пульсе — у tulp.ru есть все шансы.

Tags:

Profile

lionet
Lev Walkin
Website

Latest Month

December 2016
S M T W T F S
    123
45678910
11121314151617
18192021222324
25262728293031

Syndicate

RSS Atom
Powered by LiveJournal.com
Designed by yoksel