Лично мнение: 25+ години в ИТ средите

инж. Свилен Арсов

Head of IT - Network Technology
LinkedIn профил →

Как започна всичко

Започнах като системен администратор в среда, където „документацията“ беше устна традиция, а бекъпът — надежда. Първият урок беше брутално прост: системите падат там, където няма план Б. С годините минах през роли като Senior System Administrator, IT Project Manager и днес — Head of IT Department. Общият знаменател: устойчиви системи под натоварване и контролирани реакции при инциденти.

Още в първите години ми стана ясно, че „работи ми на моята машина“ е антипатърн. Започнах да въвеждам стандарти — именуване, версии, процедури за промяна, минимални права, ясни ролеви разделения. Това премахна излишните „героизми“ и превърна хаоса в предвидим процес.

Паралелно изградихме навици за наблюдаемост: измерими SLO, аларми с праг и действие, трасета и метрики, както и регулярни post-mortem срещи без търсене на виновни — само причини и подобрения. Малките автоматизации (backup проверки, health-checks, ротация на логове, базови плейбукове) намалиха MTTR и донесоха тишина в 3 сутринта.

Постепенно заменихме „еднократни хитрости“ със платформа: сегментирани мрежи, високодостъпни услуги, репетирани DR сценарии и редовни тестове за възстановяване. От тогава принципът ми е същият: просто, видимо, възпроизводимо.

Защо продължавам

Защото е възможно ИТ да е тихо: без нощни събуждания, с ясни процеси и предвидимо възстановяване. Удовлетворението идва от екип, който работи уверено по план, а не героично „на пожар“.

Автоматизация, която намалява MTTR, не само слайдове.
Наблюдаемост и сигурност като ежедневие, не проект.
Проста архитектура → по-малко изненади.

Най-ценните уроци от 25+ години

1) Автоматизацията е за спокойни нощи, не за красиви отчети.
Тишина в 3 сутринта, не само графики в 9. Аларми без шум, playbook-и без изненади, възстановяване без геройства.
2) Прозрачност към бизнеса.
Езикът е риск → стойност → срок. Никакъв „магически ИТ дим“.
3) Скритите зависимости са най-скъпият риск.
Картографирай системи и данни. Документирай. Тествай „what-if“ сценарии.
4) Бекъпът не съществува, ако не е възстановяван.
Разпети петък не е ден за първи restore. Disaster recovery се репетира, не се импровизира.
5) Сигурността е процес, не проект.
Минимални права, observability, бързи реакции, постмортеми без „виновни“ — само причини и подобрения.
6) Простото печели.
По-малко движещи части = по-малко нощни драми. HA, не „супер-система с тайни ритуали“.

Как мисля като Ръководител ИТ отдел (Head of IT Department)

Надеждност → Сигурност → Скорост → Цена. В този ред. Проектът е успешен, ако:

Компонент може да падне, без да падне услугата (правилна сегментация + HA).
Имаме измерима видимост (метрики и логове, трасета, ясни аларми).
Възстановяването е упражнявано (DR тестове), не теоретизирано.
Екипът знае кой, как и защо — без „one-man show“.

Мярката ми за резултат е MTTR и спокойствието на дежурния, не броят тикети.

Грешки, които ме научиха

„Ще го пуснем и после ще оправим“ — „после“ винаги е по-скъпо и по-болезнено.
Тишината в мониторинга не значи здраве — често значи мъртви аларми.
„Нямаме време за документация“ = нямаме време за скалиране.

Стек, който уважавам

Мрежи и периметър: MikroTik, OPNsense / WireGuard. Виртуализация: Proxmox VE / VMware. Сторидж: ZFS, Ceph. Мониторинг и сигурност: Zabbix, Wazuh, Fail2Ban. Автоматизация: Ansible.

Не гоня лога — гоним сигнали. Не гоня новото — гоним устойчивото.

Съвет към младите в ИТ

Основи, после мода. Мрежи, ОС, файлови системи, DNS. Това не излиза от мода.
Пишете и чертайте. Тикети, промени, постмортеми, карти на зависимости — мисленето минава през писалката.
Автоматизирайте малкото. Малките скриптове спасяват големи нощи.
Търсете отговорност, не титла. Титлите идват след тежестта.

Моята мантра: „Надеждността се проектира, сигурността се изгражда ежедневно, а спокойствието на екипа е най-добрата метрика.“

— инж. Свилен Арсов

Често задавани въпроси (личен контекст)

Какво правя в първите 30 дни при нов клиент?

Карта на инфраструктурата, базов одит на сигурността, инвентар, критични рискове + план 30/60/90.

Кое сваля MTTR най-бързо?

Еднозначни SLO аларми, дежурства по график, шаблони за комуникация, готови процедури за rollback.

„Enterprise“ срещу „plain & proven“?

Меря MTTR, TCO за 3 години, уменията на екипа и зависимостите. Простото печели, ако покрива рисковете.

инж. Свилен Арсов

Длъжност: Head of IT

Опит: Efbet, НДК, Софийски градски съд, НЗОК

Фокус: Надеждност, сигурност, наблюдаемост и бързо възстановяване

Образование: Информатика и телекомуникации

Искате да обсъдим вашата среда?

Кратък разговор и приоритизиран план. Без риск за продукцията.

Заявете консултация 📞 +359 2 958 6535

Урок по надеждност: 25+ години по-късно

Лично мнение: 25+ години в ИТ средите

Най-ценните уроци от 25+ години

Как мисля като Ръководител ИТ отдел (Head of IT Department)

Грешки, които ме научиха

Стек, който уважавам

Съвет към младите в ИТ

Често задавани въпроси (личен контекст)

инж. Свилен Арсов

инж. Свилен Арсов

Искате да обсъдим вашата среда?

Прочетете също