nuclight: (Default)
nuclight ([personal profile] nuclight) wrote2011-08-03 07:14 am

Каковы проблемы FreeBSD и пути их решения? Часть 1: Рампочта.

Три недели назад Андрей Шетухин, руководитель отдела почты Rambler, сообщил о начале миграции своего почтового кластера (порядка 500 серверов) с FreeBSD на Linux (Debian/Ubuntu), поскольку FreeBSD перестала его устраивать. Дискуссия в комментах, которых уже более полутысячи, разгорелась нешуточная. В комментах также стало известно, что аналогичный переход планирует Яндекс на своем поисковом кластере, который в данный момент работает целиком на FreeBSD, а это примерно 25000-30000 серверов, и порядка 60% мощностей Яндекса. Такая потеря — это для FreeBSD уже серьезно. С такими тенденциями система, к радости ликующих подонков, станет таки умирать.

Очевидно, что подобные решения не принимаются на ровном месте, и существуют определенные причины, проблемы, которые мы, FreeBSD, можем начать исправлять, пока не стало слишком уж поздно. BSD-сообщество привыкло закрывать глаза на многие проблемы, считая их несущественными. Более так поступать нельзя — легко списать всё на тараканы в голове менеджмента и ничего не делать, вот только постоянное повторение такого образа действий приведет к тому, что лет через 5 работу BSD-администратора будет уже не найти (Вы такую перспективу себе хотите? Я лично — нет). Однако, с другой стороны, тот же Шетухин 3 месяца назад писал "Вывод простой: миграция на Linux нецелесообразна, так как затраты на нее не окупятся" о том, что разницы в производительности FreeBSD и Linux для их целей не выявлено. То бишь, следует отделить зерна от плевел и решать те проблемы, которые действительно есть.

Таким образом, имеется два утверждения (которые будут более подробно рассмотрены далее), причем оба истинные и друг другу не противоречат:

I. Конкретно в случае Рампочты уход с FreeBSD затеян из-за неадеквата руководства, внутри у них полный бардак (по словам инсайдеров).
II. У FreeBSD действительно есть серьезные проблемы, нам необходимо их решать, иначе нам каюк.

По второму вопросу — в следующем посте предполагается анализ, каковы еще проблемы FreeBSD и как их можно решить, с опросом мнения читателей. Но сначала — о том, почему держателям акций Рамблера стоит продавать их, пока курс еще хороший.

Часть I. Конкретно в случае Рампочты уход с FreeBSD затеян из-за неадеквата руководства, внутри у них полный бардак (по словам инсайдеров).

Что выяснилось в процессе обсуждений как в комментах к посту, так и в других местах? Например, то, что проблемы и претензии Рампочты к FreeBSD были вызваны во многом их собственной спецификой. А именно, это закрытый отдел, и они не используют наработки остальной части Рамблера. В условиях больших систем нормально организовывать работу ведь следует как? Делается собственная сборка системы, часть машин выделяется под компиляцию (сборку пакетов), часть под тестирование. Этот процесс требуется всегда, какой бы там дистрибутив не стоял — даже с самым бинарным будет сделан свой локальный репозиторий, в котором собираются пакеты под задачи фирмы. И распространяются пакеты аналогично. Может быть видоизменен инсталлятор для автоматизации разливки на новые машины кластера, и т.д.

Но у них, в отделе почты, свой инсталлятор, они не пользуются, например, тем, что сделано у работающего в соседнем отделе Глеба Смирнова, коммитера FreeBSD. Из высказанных претензий складывается впечатление, что администраторам Рамблер-почты неизвестно ни про freebsd-update(8) — средство бинарного апгрейда базовой системы, имеющееся в ней уже 5 лет (обновляет в две простые команды, "скачать" и "поставить"). Ни про portmaster, написанная на чистом /bin/sh утилита обновления пакетов, альтернатива portupgrade — претензия к которому была, что он тянет за собой язык Ruby.

Аргументов было много, внятный перечень (я тут свёл воедино из нескольких разных комментов) был таким:
Ок. Давайте осилим тиндербокс. Давайте осилим бинарные обновления базовой системы и пакетов. Давайте подтянем версию FreeBSD к текущей. Давайте забьем на тупизну ipfw и убогость pf по сравнению с iptables. Давайте все собирать древним как говно мамонта компилятором. Давайте жить на ufs2. Давайте сделаем еще миллион прекрасных в своей глупости вещей, лишь бы не уходить с труъ-системы на негодный Линукс.

Все это прекрасно, но моим админам не платят за название операционки. Им платят за то, чтобы все работало. Сделать так, чтобы все работало на Линуксе, объективно проще, чем на FreeBSD. Пройдет еще 3-5 лет, и фря станет системой исключительно для маргиналов.

1. Убить такое понятие как монолитная base sysem, сделать набор пакетов для base system и для ports.
Компилировать и патчить мир в 2011 году — уебанство. Кроме того, куча вещеий из base system не нужны большинству юзеров. Значит, их и ставить не надо. Тот же bind, который не запускается на 99.5% серверов. Хрена он там делает в base system?

2. Отказаться от сборки пакетов как от основного способа установки ПО.
Пакеты должны ставиться из репозитория, и только. Нужно что-то свое — делайте набор ПО чтобы подключить локальный репозиторий на машине.

3. Сделать -STABLE репозиторий с пакетами, регулярно обновляемыми патчами.
Да, это напрягает — искать патч к X.Y.Z версии одного пакета только потому, что другой пакет хочет только ее.

4. Разработать систему автообновлений, позволяющую с минимумом головной боли содержать up-to-date систему. Ключевое слово: АВТОобновлений.

5. Самое важное: все это должно быть "из коробки", без доустановки и чтения инструкций.

Я ничего против портов не имею, это наоборот, очень удобно и классно. А вот к менеджеру пакетов претензии есть.

Серьезные ли это причины? Серьезные, хотя разбираться мы с ними будем позже. Но, однако в другом месте встречаем признание: "Собственно, все пертензии к деплойменту — невозможность в автомате с учетом всех требуемых зависимостей поднять версию системы и/или переустановить те пакеты, которые требуются. Это — прямое следствие использования pkg_*."

Решаема такая проблема с FreeBSD? В принципе, решаема, но требует скриптования. Вполне понятно и желание не заниматься рутинной работой, которую уже сделали другие. Другое дело, что максимально её сложить с себя можно только, если кто-то это будет делать на оплачиваемой основе. Вполне резонно следующее мнение: "Удивительно, что Rambler, ища стабильность и уверенность + иметь возможность своих админов отпускать вечерами домой к семье выбрали опять черти что, а не коммерческий RedHAT, где они получат любую консультацию почему у них что-то не работает. А ведь для такой конторы как Рамблер стабильность должна быть на первом плане, а они ищут халявки. позор."

Тут-то уже закрадываются подозрения, что не во FreeBSD дело — ведь, как резонно отмечали, даже конкретно Debian не уменьшит работу админов до нуля как по волшебству. Подозрения закрадываются в том, что текущие админы Рампочты попросту не в состоянии адекватно управляться с FreeBSD. Так ли это? [livejournal.com profile] slonik_v_domene пишет по этому поводу:
Из админов ушел ровно один человек, было это в конце весны 2009 года. Причины, по которым мы расстались очень просты и печальны: мы не смогли работать друг с другом. Тем не менее, расставание прошло без ругани и взаимных истерик. И несмотря ни на что, к этому человеку я испытываю уважение за профессионализм и умение твердо отстаивать свои принципы, даже ценой рабочего места.

Далее находится (в IRC) сам этот ровно один человек, это был [livejournal.com profile] ospf_ripe, и комментирует заявление "FreeBSD сложно майнтейнить" так:
Wed 22:46:44 <@citrin> nuclight: не очень понятно что там маинтейнить, а миграция будет очень сложно и трудозатратной (до прихода slonik-v-domene я работал в Рампочте и представляю что там есть внутри)
Wed 22:52:18 <@citrin> обсуждать не хочется и смысла не вижу. собственно я и ушел оттуда из за того, что с Шетухиным сложно вести конструктивный диалог. Он любит все решения принимать сам, ни с кем не советуясь и не аргументируя свою точку зрения.

Аналогичной точки зрения придерживаются и другие сотрудники Рамблера. В частности, известно, что оттуда в свое время уволился и Максим Дунин ([livejournal.com profile] mdounin). Сам [livejournal.com profile] slonik_v_domene от комментариев насчет него отказался, а Глеб Смирнов высказался по этому поводу так:
Tue 16:17:37 <@glebius> ну, если бы Максим был здесь, то я думаю слоник бы не начал этого манёвра
Tue 16:17:56 <@glebius> потому как начальству будет видно, что это просто перестановка мебели
Tue 16:18:11 <@glebius> а сейчас понимающего начальства нет, так что можно попереставлять

[UPDATE:glebius@ поправляет, что это был не [livejournal.com profile] mdounin, а maxim@freebsd.org]

По непроверенным слухам, [livejournal.com profile] slonik_v_domene работал ранее в компании СУП (которой принадлежит ЖЖ) и был оттуда уволен за примерно такие же действия — взять и устроить революцию работающей системы без оснований.

Прямых подтверждений тому у нас нет, зато косвенных — валом. Например, мной был задан вопрос, чего не хватает FreeBSD, как нам можно её улучшить. Ответом был приведенный выше перечень, что именно стоило бы сделать. Однако последовавшее за этим обсуждение показало странные вещи. Глава Рампочты никак не хочет признаваться, в какие же именно затраты рабочего времени администраторов (то есть в конечном счете финансовые затраты) выливается та или иная проблема FreeBSD. Например, еще более-менее понятно, чем плох BIND в базовой системе, хотя даже по этому вопросу конкретику с цифрами я почему-то получил от другого человека. А вот чем администратору мешает наличие в базовой системе какой-нибудь мелкой утилиты, скажем, make — уму непостижимо. Если она не используется — она вообще не требует внимания админа, лежит себе да лежит. Если её требует кто-то по зависимостям — она всё равно будет поставлена по зависимостям, что во фре, что в дебиане. Если всё ставить вручную — наоборот, требуется время админа на расстановку галок в инсталляторе (или его эквиваленте), никакого выигрыша...

Такой отказ в назывании конкретики говорит о том, что причины не технические. А тут еще выясняется что? Что из Рамблера по-тихому, 3 месяца назад, ушел Игорь Сысоев, автор известного web-сервера nginx. Итого, из Рамблера ушло уже трое. Между тем, внимания заслуживает еще такая цитата:
> что подходы рампочты к администрированию конкретно fbsd, мягко говоря, плохие.

Ну, плохие и плохие. Будет Линукс вместо FreeBSD, будут хорошие подходы. Что-то возразить по существу описанных с портами проблем есть?

Изменятся ли подходы от смены систем? Ни разу, "внезапная революция в мосгах, бывает ли такое". Подходы зависят от людей. Заблуждение о том, что есть "серебряная пуля", инструмент, с которым все проблемы сразу решатся, к сожалению, популярно... В другом треде в обсуждении [livejournal.com profile] slonik_v_domene также заявлял о том, что предпочтительны системы, с которыми справится и новичок. Он считает, что "первопричина — это не люди, а системы. А люди — следствие". В действительности же — именно люди, ключевым является именно персонал, а не инструменты. Нет смысла останавливаться на этом подробно и переубеждать того, кто до понимания положения "кадры решают всё" еще не дорос. Я просто процитирую по этому вопросу классика:
Выдающиеся проектировщики. Главная проблема совершенствования искусства программирования заключена, как всегда, в людях. [...] Выбор правильного метода проектирования определяет различия между плохим и хорошим концептуальным проектом, но не между хорошим и выдающимся. Выдающиеся проекты создаются выдающимися проектировщиками. Создание программ является творческим процессом. Крепкая методология может придать силу и освободить творческий ум, но она не может воспламенить или вдохновить того, кто занят нудной работой.
И разница немалая — это как Сальери и Моцарт. Одно исследование за другим показывают, что лучшие проектировщики создают структуры, которые быстрее, меньше по размеру, проще, понятнее и разработаны меньшими усилиями. Различия между выдающимся и средним достигают порядка величины.
[...]
Как растить выдающихся проектировщиков? Место не позволяет обсуждать это пространно, но вот некоторые очевидные шаги:
  • Систематически и как можно раньше выявлять первоклассных проектировщиков. Лучшие — не всегда самые опытные.

  • Назначить наставника, ответственного за рост перспективного проектировщика и тщательно следить за его карьерой.

  • Разработать и осуществлять план служебного роста для каждого перспективного проектировщика, включающий тщательно продуманное обучение у передовых проектировщиков, периоды дополнительного формального обучения, краткосрочные курсы, перемежающиеся с самостоятельным проектированием и назначением на руководящие технические должности.

  • Обеспечить возможности для взаимодействия и взаимного стимулирования растущих проектировщиков.

(с) Фредерик П. Брукс. "Мифический человеко-месяц или как создатся программные системы".


В Рамблере же всё происходит с точностью до наоборот. Кроме того, Андрей Богородский прокомментировал, что штатная сетка рампочты привела его в тихий ступор — с точки зрения риск менеджемента два человека администраторов недостаточно даже для текущего саппорта, что уж говорить о развитии (чтобы от болезней/свадеб/отпусков не зависеть, по КЗОТу для обеспечения круглосуточной работы должно быть минимум 5 человек на клетку).

[UPDATE: Эта ситуация относилась к 2008 году. Как сообщает А. Шетухин, сейчас сисадминов хватает для покрытия всех суток.]

В довершение ко всему, глава Рампочты еще и относится наплевательски к сообществу и исповедует паразитизм, считая, что его должны носить на руках уже за сам факт использования системы. Этика между тем проста: ему дали систему забесплатно, он ничем разработчикам не обязан, но и не имеет права требовать от них ничего, а уж тем более вставать в позу и оскорблять кого-то. Вот если бы помог хоть чем-то (тот же Яндекс, скажем, помогал)... но он хамски требует. И, не получив, уходя, он предпочитает обосрать всех и вся. Может быть, и специалисты из Рамблера сбегают из-за такого отношения руководства?..

Как бы там ни было, потеря уже невелика. "С таким подходом через 3-5 лет Рамблером не будет пользоваться никто, кроме маргиналов". Прощай, Рамблер! А мы пойдем дальше разбираться со своими проблемами сами.

Часть II. У FreeBSD действительно есть серьезные проблемы, или мы их решаем, или нам каюк.

опубликована отдельным следующим постом

Это гениально.

[identity profile] gornal.livejournal.com 2011-08-04 07:40 am (UTC)(link)
"Итого, из Рамблера ушло уже трое." (c)

[identity profile] frotmnenogi.livejournal.com 2011-08-04 09:02 am (UTC)(link)
единственная альтернатива AIO для дисковых операций - блокируемый ввод-вывод: на примере pread(2) и pwrite(2) вы можете заметить некоторую неоднозначность при попытке перевода обработки в диспетчер событий. Но у режима блокирования недостаток - жесткая привязка к потокам. С другой стороны один поток для AIO может задать сразу несколько задач по съему и наполнению данных во ФС (с сокетами сокетов тоже) - lio_listio(2).

Re: Это гениально.

[identity profile] slonik-v-domene.livejournal.com 2011-08-04 10:13 am (UTC)(link)
Я тоже проникся.

[identity profile] reddoggad.livejournal.com 2011-08-04 01:36 pm (UTC)(link)
"У FreeBSD действительно есть серьезные проблемы, или мы их решаем, или нам каюк." будет дописана сегодня? ну очень уже интересно увидеть продолжение!

[identity profile] alexclear.livejournal.com 2011-08-04 03:18 pm (UTC)(link)
> и был оттуда уволен за примерно такие же действия — взять и устроить революцию работающей системы без оснований.

Знаем мы эту "работающую систему".

[identity profile] alexclear.livejournal.com 2011-08-04 03:19 pm (UTC)(link)
Хотя, если Вы Perl developer, вопросов нет.
Работающая система, окей.

[identity profile] alexclear.livejournal.com 2011-08-04 03:50 pm (UTC)(link)
В целом, прочитав Ваш труд я сделал для себя примерно такой вывод:

Поскольку перевод инфраструктуры с FreeBSD на что-то другое ваша банда IRC-шников с седыми мудями уважаемое сообщество воспринимает как следствие неадеквата руководителя, грамотный руководитель, желающий выглядеть в сообществе адекватным, вообще не должен подходить к сраной FreeBSD на пушечный выстрел.

Первые доказательства того, что системный администратор должен системно администрировать, а специалист по связям с общественностью - связываться с общественностью, Вы предоставили еще в памятном обсуждении у коллеги Шетухина, но Вам, видимо, показалось, что они тогда были как-то неочевидны, что ли.

(в сторону) Коллега [livejournal.com profile] _slw, помнишь, я тебе в обсуждении у коллеги Слоника писал про отсутствие адекватного маркетинга и прочее?
Вот оно, в полный рост.
Друзья FreeBSD'сты, пока вы сами воспринимаете свою систему только как любимую игрушку и начинаете позорнейшим образом плакать, хотя ее еще пока что не отобрали, бизнес будет вас игнорировать, привет.

[identity profile] alexclear.livejournal.com 2011-08-04 04:23 pm (UTC)(link)
В Рамблере же всё происходит с точностью до наоборот. Кроме того, Андрей Богородский прокомментировал, что штатная сетка рампочты привела его в тихий ступор — с точки зрения риск менеджемента два человека администраторов недостаточно даже для текущего саппорта

Скажите, Вас не смущает тот факт, что Вы даете ссылку на штатную сетку рампочты 2008-го года (по Вашей ссылке написано, что руководителем является Капранов, а не Шетухин)?
Остальные приведенные Вами факты - они настолько же достоверны?

[identity profile] reddoggad.livejournal.com 2011-08-04 04:24 pm (UTC)(link)
Вы о BSD в целом, или на конкретном примере компании?

[identity profile] alexclear.livejournal.com 2011-08-04 04:58 pm (UTC)(link)
Речь шла конкретно о проекте модернизации движка LJ.
Как он работает, мы могли не так давно наблюдать.

Re: > я вообще его не люблю и пользуюсь ipfw.

[identity profile] nil59.livejournal.com 2011-08-04 06:41 pm (UTC)(link)
это, положим, не так. особенно в сочетании с dummynet ipfw хорош.

таблицы со значениями и автоматическое создание пайпов позволяют заделать шейпер на пару десятков тысяч клиентов натурально в количествоТарифов*2+6 строчек.

но - freebsd тут как бы и не при делах - dummynet+ipfw есть под linux.

Re: Это гениально.

[identity profile] dil.livejournal.com 2011-08-04 06:46 pm (UTC)(link)
Так, я что-то совсем запутался. Ты сам-то сейчас где?

Re: > от просто роутинга

[identity profile] nil59.livejournal.com 2011-08-04 06:47 pm (UTC)(link)
это правильная, но непопулярная точка зрения :)

боюсь - прийдется продолжать называть форвардинг роутингом, как раз для единства терминологии с народными массами...

[identity profile] http://users.livejournal.com/_slw/ 2011-08-04 07:02 pm (UTC)(link)
(в сторону) Коллега [info]_slw, помнишь, я тебе в обсуждении у коллеги Слоника писал про отсутствие адекватного маркетинга и прочее?
Вот оно, в полный рост.
Друзья FreeBSD'сты, пока вы сами воспринимаете свою систему только как любимую игрушку и начинаете позорнейшим образом плакать, хотя ее еще пока что не отобрали, бизнес будет вас игнорировать, привет.

я видимо не улавливаю каких-то моментов.
а может у тебя больше информации (и/или инсайда) по рамблер-почте.

или ты просто хочешь сказать, что проекту FreeBSD очень было бы желательно обзавестись человеком, способным все тоже самое изложить другими словами и так, что бы у шетухина появилось желание еще раз попробовать сыграть с FreeBSD?

[identity profile] alexclear.livejournal.com 2011-08-04 07:08 pm (UTC)(link)
> или ты просто хочешь сказать, что проекту FreeBSD очень было бы желательно обзавестись человеком, способным все тоже самое изложить другими словами

Да.

> что бы у шетухина появилось желание еще раз попробовать сыграть с FreeBSD?

Боюсь, рамблер-почта для фри потеряна в тактической перспективе.
Проблема в том, что подобного рода манифесты, как выше, больше отпугивают новых пользователей, чем привлекают.

Re: > от просто роутинга

[identity profile] http://users.livejournal.com/_slw/ 2011-08-04 07:36 pm (UTC)(link)
главное -- договориться что есть nat.
а то то, что все вокруг называют nat в документации от кошкастых называется pat.

Re: Это гениально.

[identity profile] gornal.livejournal.com 2011-08-04 07:37 pm (UTC)(link)
Я сам в мейл в прошлом году вернулся, а в Рамблере был всего полгода в 2006-ом, но юзерпик храню как светлую память.

[identity profile] http://users.livejournal.com/_slw/ 2011-08-04 07:53 pm (UTC)(link)
Боюсь, рамблер-почта для фри потеряна в тактической перспективе.
что-то мне подсказывает, что как раз сейчас у линукса начинается инетерсный период.
но могу и ошибаться.

[identity profile] oldmann.livejournal.com 2011-08-04 08:11 pm (UTC)(link)
куда смотрит Моксим? тем более что Моксим и коммиттер, и топ-менеджер!

Re: > Проще сказать «говорят». ;-)

[identity profile] permea-kra.livejournal.com 2011-08-04 09:34 pm (UTC)(link)
В чем пиздецовость ext3 и что юзать вместо неё?

[identity profile] permea-kra.livejournal.com 2011-08-04 09:41 pm (UTC)(link)
Где там эмуляция? libaio работает на ядреных вызовах. Асинхронных.

[identity profile] slonik-v-domene.livejournal.com 2011-08-04 10:48 pm (UTC)(link)
>Вполне резонно следующее мнение: "Удивительно, что Rambler, ища стабильность и уверенность + иметь возможность своих админов отпускать вечерами домой к семье выбрали опять черти что, а не коммерческий RedHAT, где они получат любую консультацию почему у них что-то не работает. А ведь для такой конторы как Рамблер стабильность должна быть на первом плане, а они ищут халявки. позор."

Удивительно, что находятся граждане, которые не читали условия предоставления поддержки RedHat, но при этом рассказывающие бред про консультации.
Вдумчиво читаем на офсайте RedHat о том, что поддерживается, и что нет.

>Кроме того, Андрей Богородский прокомментировал, что штатная сетка рампочты привела его в тихий ступор — с точки зрения риск менеджемента два человека администраторов недостаточно даже для текущего саппорта, что уж говорить о развитии (чтобы от болезней/свадеб/отпусков не зависеть, по КЗОТу для обеспечения круглосуточной работы должно быть минимум 5 человек на клетку).

Этот относится, судя по всему, к 2008 году, и реальной действительности не соответствует. Сейчас сисадминов достаточное количество для покрытия всех суток.

Рекомендую убрать этот бредовый абзац.

[identity profile] slonik-v-domene.livejournal.com 2011-08-04 10:56 pm (UTC)(link)
>а может у тебя больше информации (и/или инсайда) по рамблер-почте.

Больше всего инсайда у меня. Сейчас мы обкатываем новую систему мониторинга на Zabbix. Параллельно с этим ведется сборка и тестирование deb-пакетов.

Задача создания тестовых сред на виртуальных машинах уже успешно решена.

>у шетухина появилось желание еще раз попробовать сыграть с FreeBSD?

Проблемы не в маркетинге. Проблемы совершенно конкретные, я о них писал много раз. Сообщество это проблемами не считает, значит, исправлять не будет. Значит, нам с ними не по пути.

Рассказами про то, что перечисленное проблемами не является, пусть фанатики подотрутся.

Еще момент. О целесообразности миграции меня интересует мнение лишь сисадминов из моего отдела. Тут возражений нет - все за.

Мнение всех остальных я на хую вертел, оно мне не интересно.

[identity profile] slonik-v-domene.livejournal.com 2011-08-04 10:58 pm (UTC)(link)
И, да.

Тот, кто выкидывает софт из системы только потому что он другой лицензии - просто тупой дегенерат. Это равно относится и к Debian, и к Red Hat, и к FreeBSD.

Re: > Проще сказать «говорят». ;-)

[identity profile] alexclear.livejournal.com 2011-08-04 11:51 pm (UTC)(link)
С настройками по умолчанию она под нагрузкой на запись работать нормально не может
Проще выбросить ее нафиг, взять hw RAID с BBU и использовать XFS.

Page 6 of 9