Тинькофф старт аналитика как готовиться

Обновлено: 18.08.2022

С 1 декабря 2021 года начинается зимний набор в «Тинькофф Старт» — программу оплачиваемых стажировок от «Тинькофф».

Три месяца участники вместе с кураторами «Тинькофф» будут работать над реальными задачами компании.

Все кураторы — опытные профессионалы в своих областях: разработчики, тестировщики, аналитики и другие эксперты «Тинькофф». Им можно задавать любые вопросы и общаться на протяжении всей стажировки. Стажер сразу погружается в рабочую среду и работает над улучшением настоящего продукта, а не над придуманной задачей. Поэтому три месяца стажировки дают сразу и практические навыки, и навыки общения и коммуникации в бизнес-среде.

Ниже — одна из задач, над которыми работают стажеры. Это проект интерна с прошлой программы «Тинькофф Старт» — Матвея. Во время стажировки он работал в команде аналитики рисков и занимался задачей учета отказов по заявкам в построении модели вероятности дефолта.

Представим, что у банка есть модель, по которой принимается решение, выдавать определенному человеку кредит или нет. Она оценивает заемщика, предсказывая вероятность его неплатежеспособности. Людям с высокой вероятностью дефолта банк отказывает, а с низкой — выдает кредит.

Вся информация о выданных кредитах находится в хранилище. Там же содержится и целевая переменная, которая служит индикатором дефолта клиента. Со временем аккумулируется все больше и больше данных. Поэтому команда решила создать новую, более мощную модель, которая будет лучше учитывать и обрабатывать весь объем информации, а также предсказывать неплатежеспособность (то есть дефолт) людей.

Здесь возникла проблема: полученная модель строится и обучается на данных только по тем людям, которым одобрили кредит. О тех, кому отказали, информации нет. Кредит они не получили, поэтому и целевая переменная для них не определена.

Когда же модель запускалась на всем потоке людей, исследовались все заявки, в том числе и очень плохие, которые в процессе обучения модель вообще не встречала. Поэтому на таких заявках модель могла вести себя некорректно и непредсказуемо. Это своеобразная ошибка выжившего.

Такого эффекта удалось бы избежать, если бы банк начал выдавать кредиты всем желающим, без учета риска дефолта на старте, а потом строить модель на полученной расширенной выборке.

Нужно было придумать другой способ и проверить его состоятельность. Именно это и стало основной задачей стажировки Матвея. Вместе с куратором они ставили эксперименты с использованием разных современных технологий.

Одна из метрик, которая позволяет оценить качество модели, называется AUC (Area Under Curve — «площадь под кривой ошибок»). Простой пример. Допустим, есть признак Х, который принимает большие значения у людей с низкой вероятностью дефолта и маленькие — с высокой. Тогда AUC — это вероятность того, что у случайного платежеспособного человека значение признака Х больше, чем у человека, который точно вышел бы в дефолт.

Так, если AUC какого-то признака равен 1, то по этому признаку можно безошибочно определить, сможет человек выплатить кредит или нет.

Действующая модель строилась только на данных клиентов, которым был одобрен кредит. Поэтому ожидалось, что AUC увеличится, когда реализуется новая техника.

В результате удалось разработать модель, которая приблизила аналитиков к полным данным. Новая модель улучшает качество разделения заявок и точнее предсказывает вероятность дефолта.

Задача Матвея была сложной, объемной и содержала массу нюансов. Сейчас он продолжает заниматься ею уже после завершения стажировки как штатный сотрудник. Матвей отмечает, что в процессе стажировки ему очень пригодились базовые знания Python и SQL. А еще математический практикум, который преподают на 3-м курсе мехмата МГУ.

Если пример Матвея вдохновил, приглашаем в команду «Тинькофф» — поработать над одним из проектов. Чтобы стать участником:

сдайте онлайн-экзамен с 1 по 22 декабря;

В программе могут участвовать студенты, магистранты и молодые специалисты из Москвы и других городов России, в которых есть Центры разработки «Тинькофф».

«Тинькофф Старт» действует с 2016 года и работает со студентами и молодыми ИТ-специалистами. Более 66% стажеров, которые прошли программу, устроились на постоянную работу в «Тинькофф».

Ну давайте я напишу. Когда я увижу в приложению сумму которая накопилась по накопительному счету? Уже год жду решения проблемы) в приложении просто нет такой информации.

Здравствуйте. Напишите ваши ФИО и дату рождения в ЛС - разберемся.

Здравствуйте. Подскажите, пожалуйста, у вас аналогичный вопрос, как и у Семёна Сердюкова?

Я не знаю где вы там баги видите может они у вас в голове))))
все отлично работает
4 года уже пользуюсь и без проблем

За 2 года ежедневного использования ни одного бага не словил, как и юзер ваше. Может, что-то у вас с устройствами?)

пользователи "тинькофф-инвестиции" регулярно ловят
как клиентские баги, так и серверные

в частности я несколько багов зарепортил

но чудес не бывает, безглючных сложных продуктов просто не существует в природе

Юзаю 4 года. Баги бывали, но критичных ни разу. + тех поддержка очень хорошо реагирует

Насчёт "приложение без багов" всё не так. По крайней мере за последний месяц описал около 10 багов, а за год составил более 100 обращений, из которых не менее четверти - баги.
Наймите уже наконец-то хороших тестеров.

«Не падает» и «без ошибок» — разные вещи.

Загрузку кэшированных остатков после актуальных, т.е. когда старые остатки затирают новые, вижу годами, и по сей день. Уже привык после входа сразу дёргать обновление.

Примитивной правки неверного типа поля ввода добиваюсь от вас уже полгода. И бесит всё больше и больше.

Всё Android, если решите в очередной раз сделать вид, что взяли в работу.

Я тоже думаю, что ты слегка преувеличиваешь. Купи новый телефон, может глючить не будет. За 4 года пользования у меня ни разу не было сбоев в работе приложения.

Тинькофф и наши Российские банки одни из лучших в мире по уровню обслуживания в тырнете. Мне вот интересно где ты найдешь такого производителя у которого все идеально, нет недочётов или каких либо ошибок? Интересно по твоему мнению кто работает в Microsoft? Если следовать твоей логике, то там тоже алкаши работают?! А если теоретически представить что есть Господь Бог, то что он тоже валялся в выгребной яме пьяный, а потом решил сотворить мир и людей, но ведь даже Господь Бог совершил ошибку сотворив тебя🤦 Просто взял голословно заявил, что банк не очень, но при этом по факту так ничего не сказал. Оно знаешь, когда что нибудь делаешь всегда будут ошибки, даже в эволюции при копировании гена предусмотрена ошибка и вот благодаря таким вот ошибкам и миллионам лет эволюции ты такой вот Шариков имеешь возможность выползти в тырнет и написать то что думаешь, а может и не думаешь ты вовсе, когда пишешь, а просто поток эмоций выплескиваешь🤦

Ооо, друзья, это вы ещё не пользовались приложением райфа). По сравнению с райфом, приложение тинькова - это просто шедевр программирования!

Живу в Беларуси и сравнивая приложения местных банков и Тинькова, скажу — грех жаловаться.
Приколы бывают, но довольно редко.
И с новым дизайном несколько неудобно траты смотреть стало, думаю специально)

Привет! Я Мария Фоменко, заместитель руководителя управления хранилищ данных и отчетности в Тинькофф. Расскажу о направлении DWH и о том, как попасть к нам в команду, что спрашивают на скрининге HR и на секциях системного анализа DWH.

Статья будет полезна тем, кто планирует расти в профессии, интересуется работой в большой компании или хочет работать именно в Тинькофф. Если узнали себя в любом из пунктов, добро пожаловать под кат 😊


Data Warehouse в Тинькофф

Наша команда занимается данными в компании. Наша миссия — распространять data-driven подход в компании, создавать единую платформу и пространство работы с данными.

Команда DWH делится на два блока:

Технический или core-блок создает платформу данных как продукт. Ключевая задача специалистов этого блока — создавать и развивать инфраструктуру нашей платформы.

Мы пишем собственные инструменты загрузки и преобразования данных и внедряем лучшие из существующих на рынке. Развиваем методологии работы с данными и их визуализации. Делимся best practice с компанией, предоставляем self-service для 3000+ пользователей платформы.

Команда состоит из разработчиков, SRE-инженеров, продакт-менеджеров и архитекторов. Мы любим open source, многое пишем с нуля на Java, Python, Scala и Golang

Бизнес-блок с помощью платформы данных, разработанной core-специалистами, предоставляет data as a product для всех бизнес-направлений Тинькофф.

Бизнес-блок состоит из команд, каждая из которых закреплена за какой-то бизнес-линией Тинькофф. Команды строят аналитическую модель данных, создают ключевую управленческую и операционную отчетность для своего направления, занимаются data governance и решают вопросы качества данных.

Команда состоит из системных аналитиков DWH, разработчиков ETL, data-инженеров, QA-инженеров, бизнес-аналитиков BI

Несмотря на то что большая команда DWH разделена на микрокоманды по задачам, у всех общий фокус на результат. При этом у каждой специализации есть не только свои стандарты, но и общие гайды и матрицы развития, все команды действуют в едином пространстве и на единой платформе.

Системные аналитики DWH входят в бизнес-блок и занимаются исследованием источников, проработкой требований заказчика, проектированием модели данных, составлением ТЗ для разработчиков, развитием data governance и разработкой data quality правил.

Этапы отбора

В Тинькофф отбор проходит в три этапа: HR-скрининг, техническое интервью из двух частей и финальное интервью. Вот как они выглядят в таблице:

Этап

Секция

Время

2. Техническое интервью

Секция SQL + логика

Секция системный анализ DWH

3. Финальное интервью

Знакомство с командой

Первый этап — интервью с рекрутером по телефону. Он спрашивает об опыте, мотивации, желаемом уровне дохода, ожиданиях, технических интересах. Уточняет опыт работы с СУБД, какие задачи с данными приходилось решать, какие с ними были сложности. Интересуется планами на ближайшее время: с чем хочется поработать, что нравится в работе.

Второй этап — техническое интервью. Состоит из двух секций: по SQL и логике и секции системного анализа DWH. На них проверяют базовые знания и уровень погружения в область хранилищ данных. Тех, кто успешно прошел первые два шага, приглашают на финальное интервью с командой.

Третий этап — финальное интервью. Там кандидаты знакомятся с командами, обсуждают особенности проекта и конкретные задачи, над которыми предстоит работать в первое время.

Техническое интервью — секция SQL + логика

На этом этапе проверяются знания и навыки по работе с данными. DWH — это петабайты данных, тысячи пользователей и сотни тысяч аналитических запросов в день. Нам важно знать, на каком уровне человек умеет работать с данными, какие конструкции приходилось писать, есть ли опыт оптимизации запросов.

Задача секции SQL — узнать уровень владения SQL, понять, что человек мыслит данными. Сложность задач, которые будут на собеседовании, определяются уровнем знаний системного аналитика. Начальный уровень он определяет самостоятельно, а потом подтверждает знание обязательных конструкций для этого и следующих уровней.

На уровне Junior собеседование всегда начинается с задач уровня Junior, а вот на уровнях Middle или Senior — с уровня Middle и продолжается по ситуации: вверх или вниз.

Часть секции отведена логическим задачам, по ходу которых отмечается, как системный аналитик раскручивает алгоритм решения, его аналитические способности.

Техническое интервью — секция системный анализ DWH

Цель этой секции — проверить на реальном кейсе навыки общения с бизнес-заказчиками: может ли системный аналитик переложить бизнес-процесс на сущности хранилища.

Решение задач проходит в формате диалога. Есть несколько сценариев, с которыми работаем на собеседовании: если у кандидата был опыт работы с DWH, то идут вопросы по платформе, а потом задачи. Если опыта нет — только задачи. В секцию входят вопросы про опыт работы с хранилищами данных, основные понятия, с какими подходами и методологиями приходилось сталкиваться.

Тайминг: сколько времени идет каждый этап

Первичный телефонный разговор длится 20–30 минут. Если все пройдет хорошо, то рекрутер согласует дату и время для технического интервью.

Техническое интервью разбито по двум разным дням и занимают около 90 минут каждое. На секцию системного анализа DWH проходят те, кто успешно справился с секцией по логике и SQL. После секций рекрутер собирает информацию по результатам технического интервью и направляет их заинтересованным командам. У них есть день, чтобы дать обратную связь, но на практике они отвечают в течение пары часов. Заинтересованные команды практически сразу присылают отклики. Тогда рекрутер возвращается к системному аналитику и зовет его на следующий этап — итоговое интервью. Это уже не собеседование, а знакомство с командами. После созвона рекрутер попросит назвать, какой проект понравился больше всего, а через день возвращается с финальным решением. Если аналитику подходят задачи и нравится команда, он получает оффер. Обычно процесс его согласования длится 1–2 дня.

Как быстрее получить оффер

Компании, для отбора в которые нужно пройти несколько этапов интервью, все чаще проводят One Day Offer — формат, когда на все эти этапы отводится один день. Для компании это возможность быстро нанять специалистов, а для кандидата — получить оффер. За один день можно пообщаться с командой, узнать о проектах, пройти технические секции и принять оффер, если работа подойдет по условиям, а задачи — по скиллам.

Я узнал о программе Тинькофф Старт от друзей — они тоже проходили стажировку или уже работают в компании аналитиками. Пообщавшись с ними, я понял, что мне тоже было бы интересно заниматься аналитикой. К тому же у нас на 2-м курсе университета был курс матстатистики и теорвера, мне нравилось.

Когда я понял, что аналитика мне интересна, я стал проходить курсы по статистике, питону и SQL. Подготовка заняла около полугода. Из полезных ресурсов могу порекомендовать:

На отборе было сложно, когда решал тест по математике, там были нестандартные задачи. Но на собеседовании было супер, были обычные задачки про стату.

Было ли сложно в начале стажировки, как проходил онбординг?

Для меня выход на стажировку был долгожданным, аж не терпелось начать. Мне очень понравилась команда, в которую меня взяли.

Стажировка была для меня первым опытом работы в крупной компании. Поначалу было сложно понять, что происходит, помогло общение с людьми. На встречах с куратором меня погружали в процесс и системы, плюс если это первый опыт, то ты не работал с многими инструментами. Банальный Slack, Wiki или Jira могут вызвать вопросы. Без куратора сложно разобраться, что происходит, поэтому очень важно наладить с ним взаимоотношения начиная с первого дня стажировки.

Каким аналитиком ты был?

Сначала я был системным аналитиком, занимался системой, которая отвечает за безопасность платежей в интернете. Но в ходе стажировки я понял, что мне интереснее работать с числами, чем с техническими вопросами, поэтому ротировался в другую команду уже как продуктовый аналитик. Здесь я работаю до сих пор, но поддерживаю контакт с прошлой командой.

На твой взгляд, в чем отличие системной аналитики от продуктовой?

Глобально задача системного аналитика — думать про техническую часть и удобство пользования системой: проанализировать и найти баг, написать спецификацию, потом поставить задачу на разработку. Продуктовый анализ — это больше про продукт, про взаимодействие с дизайном и продуктовыми менеджерами. То есть погружение в продукт гораздо больше.

Какие советы можешь дать тем, кто только думает про стажировку?

  1. На интервью не нервничайте. Даже если у вас не много релевантного опыта, это не блокер. Собеседующие увидят ваш потенциал.
  2. На самой стажировке задавайте побольше вопросов, даже если кажется, что они глупые. Иначе можно неправильно понять задачу и делать не то что нужно.
  3. Старайтесь сами погружаться в процессы, чтобы показать хороший результат и прийти с оригинальной идеей.

Яна Зенкова

МФТИ, ФИВТ (ФПМИ) 4 курс

Почему пошла на стажировку?

Хотелось попробовать для себя более прикладную математику, до этого занималась только теоретическими штуками. Решила, что Тинькофф — это классное место, чтобы узнать, как математика применяется в реальной жизни. Еще было интересно, как живется в больших компаниях.

Изначально выбирала между ML и аналитикой, но в приоритете была аналитика, показалось, что спектр задач шире и интересней.

Было ли сложно при отборе?

К отбору я готовилась, в обсуждениях почитала задачи прошлых лет и прорешала их (тогда еще не спрашивали SQL). Перед собеседованием делала примерно то же самое. Я примерно понимала, какой технический стек хотят видеть работодатели: теорвер и матстат, SQL. Питон обычно тоже хотят видеть, но на собеседованиях больше спрашивают задачи на нестандартное и аналитическое мышление, чтобы проверить, как кандидат подходит к решениям разного рода задач и насколько умеет мыслить вне рамок. Особой дополнительной подготовки (онлайн-курсов, кучи лекций и др.) не было, так как большую часть знаний я получила в вузе по специальности.

Чем занималась на стажировке?

Моя команда занимается агрегацией данных о клиентах, плюс мы несем ответственность за микросервисы на основе данных. У нас есть проект по построению и поддержке модели сегментации клиентов. Задачи по этому проекту мне дали на стажировке, и я продолжаю над ним работать и в штате.

То есть это смесь ML и числовой аналитики. В целом мне нравится проект: нужно думать, откуда достать данные, как обработать и как привести в числовые признаки. При этом очень важна интерпретируемость полученных результатов модели: тут нужно уметь выделять самые важные признаки, а коррелируемые объединять в группы, не забывая про бизнесовую интерпретацию.

Расскажи про процесс онбординга

Первое время было много незнакомых слов — начиная от сокращений и заканчивая банковскими терминами. Но у нас есть база знаний на Wiki, и первые дни начинаются с того, что ты читаешь Wiki и разбираешься, чем занимается команда и отдел. Я сразу поняла, где какую инфу искать и что нужно самостоятельно попробовать поискать ответ, прежде чем спрашивать.

Мне очень понравилось, что не было технических проблем: с доступами и с ноутбуками. Очень рада, что в Тинькофф с этим все гладко.

Привет! Мы стажеры в Тинькофф. В этой статье расскажем, над какими проектами мы работали в ходе программ Тинькофф Старт.

Как все устроено

Тинькофф Старт — программа стажировок от Тинькофф. Ее участники на протяжении трех месяцев в течение учебного года или двух месяцев фултайм работают над задачами компании. Отбор проходит три раз в год, нужно решить онлайн-экзамены и пройти интервью. Подробнее о том, как устроен отбор на Старт, можно прочитать в статье.

Какие бывают аналитики

Один из самых популярных направлений на стажировке — аналитика. В Тинькофф работают четыре вида аналитиков, и все они занимаются разными вещами. Мы выделяем продуктовых, системных, риск-аналитиков и технологов:

— продуктовые аналитики ищут точки роста продукта, на основании полученных данных формируют продуктовые гипотезы и проверяют их;

— системные аналитики занимаются проработкой архитектурных решений и продумывают, как именно должны быть реализованы требования на уровне систем;

— риск-аналитики занимаются поиском положительных и отрицательных рисков, тщательно проводят анализ всех возможных решений по их устранению;

— технологи организуют бизнес-процессы и отвечают за реализацию идеи.

Помочь определиться с тем, какой ты аналитик, может наш мини-тест.

Перевод СМС-уведомлений в пуш

Иван

ВМК МГУ

После этого поставил задачи на разработку. Вместе с куратором мы наладили связь с ответственными за эти типы отделами и обсудили план переноса. Некоторым отделам, чтобы согласиться на нашу инициативу, нужен был более детальный анализ, эту задачу я взял на себя тоже.

Кроме магистральной задачи было много более мелких задачек. Например, доработать отчет или выяснить, какой тип пуш-уведомления куда ведет при нажатии.

К концу моей стажировки по одному типу мы полностью перешли на пуш. По всем остальным выбранным типам начали работу в этом направлении, создали потребность у владельцев бизнес-линий для переноса своих типов на пуш, был отлажен процесс.

Мне ощутимо пригодился спецкурс по SQL от кафедры ИИТ ВМК МГУ, он дал мне достаточные для выполнения задач знания.

Аналитика по акции «Приведи своих»

Денис

мехмат МГУ

Мы предлагаем юридическим лицам порекомендовать сервисы своим знакомым и получить за это бонусы. Это называется «Приведи своих».

По проспекту акции нельзя было понять, сколько компания потратила на фактические выплаты, на звонки. Все проводимые тесты по акции хранились в разных местах и со временем терялись. Из-за этого было трудно и ресурсозатратно оценить успех проведения акции. Возникла необходимость сегментировать юридические лица, попытаться выделить тех, кто приводит друга чаще, а также собрать все данные о костах и результаты тестов в одну таблицу, добавить значения present value.

Для начала я попытался сегментировать юридические лица. Просматривал ОКВЭД, тип юридического лица и прочие признаки. Коммуницировал с другими аналитиками, и мы вместе рассуждали, имеет ли смысл делать сегментирование. Сегментирование не выявило особых аномалий, поэтому сделали вывод, что дальнейшая работа в данном направлении не особо продуктивна.

Дальше проработали структуру таблицы для хранения данных. Протестировали обновление, добавили новые тесты. Теперь все проводимые тесты хранятся в одном месте, это позволило все практически онлайн отслеживать в виде красивых дашбордах. По ходу дела поправили многие баги и неточности.

На следующем шаге посчитал косты и present value, то есть число вложенных средств на заявку по акции.

По ходу проекта решал еще много коммуникационных и технических задач. Например, многие аналитики имели неоптимальные процессы сбора данных по задаче. Все эти процессы доработали и подстроили под задачу. В дальнейшем можно еще оптимизировать запросы при сборке таблицы для быстрой работы.

Для работы над проектом мне нужны были основы SQL, оптимизация запросов и Python. Вся эта техническая часть мной бралась из стандартного учебника по SQL (вроде «Введение в SQL»).

Из софт-скиллов главными оказались коммуникабельность, умение выстроить быстрый процесс передачи информации. Мы же не были в вакууме :)

Измерение качества экосистемы Тинькофф

Миша

ФИВТ МФТИ

Сейчас развитием экосистемы и измерением ее качества занимается много компаний. Подобного в Тинькофф не было, и я взялся этим заниматься. В итоге мы с командой придумали несколько метрик, измеряющих качество экосистемы, а затем их визуализировали.

Моя команда называлась product quality, занимается измерением качества продуктов Тинькофф, по отдельности и в целом. Я измерял метрику «экосистемность» — она показывает профит от использования нескольких продуктов Тинькофф.

Сама по себе метрика непонятная. Поэтому для начала нужно было придумать другие параметры, которые бы отражали метрику, а затем все подсчитать и визуализировать. Работал я более-менее автономно, по всем возникающим вопросам спрашивал своего куратора и ребят из команды.

Так как работал я с несколькими продуктами, нужно было плотно взаимодействовать с ребятами из команды, у кого были задачи со связанными продуктами.

На проекте нужно было много придумывать, писать на SQL, писать на Python. Визуализация была в Tableau. Почти все из инструментов я знал, но набрался опыта в запросах на SQL, научился общаться с людьми (это основное, наверное), расширил свои знания о работе банка, какие продукты развивает и т. п.

За экосистемой необходимо следить. Для этого нужно придумать хорошие метрики для оценки качества, улучшить мои и визуализировать новые. Одна из самых простых метрик — распределение по числу продуктов у клиента. Чуть сложнее — число активных продуктов. Также удалось построить скорость доставки по каждому продукту, но это не метрика, а просто наглядная визуализация.

Учет отказанных заявок в построении pd-модели

Матвей

мехмат МГУ

Мне посчастливилось пройти отбор именно на то направление, на которое я изначально хотел — аналитика рисков. В процессе стажировки у меня была интересная и необычная задача, которую коротко и лаконично можно назвать reject inference. Суть ее в следующем:

Представим, что у банка есть модель, по которой принимается решение — выдавать данному человеку кредит или нет. То есть модель пытается «скорить», оценивать заемщика, предсказывая вероятность его дефолта. Естественно, людям с высокой вероятностью дефолта банк отказывает, а с низкой — выдает кредит. Вся информация о выданных кредитах хранится в банке, в том числе и целевая переменная, которая является индикатором дефолта клиента. Со временем аккумулируется все больше и больше данных, и мы решаем создать новую модель, которая будет лучше предсказывать ненадежных (то есть, вышедших в дефолт) людей.

И вот здесь возникает проблема — новая модель строится и обучается на данных только по тем людям, кредит которым мы одобрили. По отказникам у нас нет информации. Кредит они так и не получили, соответственно, и целевая переменная для них не определена. Когда же мы запускаем модель на всем потоке людей, мы начинаем скорить по ней все заявки, в том числе и «очень плохие», которые в процессе обучения модель вообще не встречала. Поэтому на таких заявках модель может вести себя некорректно и непредсказуемо. Это своеобразная ошибка выжившего.

Конечно, банк может выдавать кредиты всем желающим, а потом строить модель на полученной расширенной выборке. Тогда указанного выше эффекта удастся избежать. Однако по понятным причинам мы так сделать не можем.

Таким образом, нужно было придумать другой способ и проверить его состоятельность. Именно это и стало основной задачей моей стажировки. Вместе с куратором мы ставили эксперименты с разными современными техниками.

В результате мы разработали модель, которая приближает нас к полным данным: улучшает качество разделения заявок и точнее предсказывает вероятность дефолта. Кроме того, она сглаживает негативные эффекты, возникающие при построении модели только на утилизированных клиентах.

Моя задача была сложной, объемной и содержала массу нюансов. В частности поэтому я продолжаю ей заниматься уже после завершения стажировки, как полноценный сотрудник.

В процессе стажировки мне очень пригодились базовые знания Python и SQL. Кроме того, сильно облегчил жизнь математический практикум, преподаваемый на 3-м курсе моего факультета.

Почти каждый день я общался со своим куратором и получал всю необходимую поддержку. Очень круто, что все вопросы, даже самые глупые, я мог задавать в любое время и получать полный и исчерпывающий ответ. Все взаимодействие с куратором происходило легко, комфортно, продуктивно и с пользой.

Оптимизация процессов в Тинькофф Страховании

Вадим

МГТУ им. Н. Э. Баумана

4 курс на момент стажировки

Я пришел на стажировку не как аналитик, а как методолог или разработчик бизнес-правил. Мои первые задачи были связаны с разработкой процессов, я с ними успешно и быстро справился, поэтому потом мне стали доверять более аналитические проекты. Я расскажу по порядку о трех задачах, которые у меня были на стажировке, каждая задача оказывалась интереснее и сложнее предыдущей.

Задача № 1: разработка консультации по продукту

Мне нужно было составить процесс консультации по страховому полису для первой линии поддержки. Для этого требовалось погрузиться в продукт, пообщаться с продуктовой командой, изучить технологическую составляющую. После того как мы поняли, какую инфу давать оператору, нужно было оформить ее в читабельный вид.

Задача № 2: создание инструмента для проведения тестов

Сейчас все данные клиентов маскируются: никто не может тестировать техническую составляющую процедур на реальных клиентах. У нас есть инструмент, который генерирует контакты людей и страховые полисы для тестов. Но на момент начала моей стажировки он был очень неудобным: не было ручной настройки, все было захардкожено, и из-за этого все полисы были однотипные и одинаковые. Нужно было сделать возможным задание параметров полиса вручную, это позволит точечно генерировать сущности и тестировать любой кейс.

Чтобы решить задачу, мне потребовалось:

  1. Собрать требования с заказчиков и выяснить, какое наполнение необходимо тестовому страховому полису. Это нужно было узнать, во-первых, у разработчиков тестовых процедур и тестировщиков, во-вторых, со стороны продукта и логики.
  2. Понять, можем ли с помощью действующего инструмента выполнять необходимые задачи. Если нет, определить методы реализации и поставить задачу на разработку.

Задача № 3: сегментирование и выявление бизнесовых правил

Эта задача была очень похожа на те, которым у нас в Тинькофф занимаются аналитики-менеджеры, мы называем их технологами.

В колл-центре Тинькофф Страхования есть маршрутизация: мы направляем клиента на группу операторов, которые проконсультируют его по части вопросов. Была задача сделать так, чтобы мы предугадывали, по какому вопросу звонит клиент. Мы сегментировали по роли в полисе, наличию убытков. Но всегда оставалась большая масса не сегментированных клиентов. Нужно было понять, что это за люди, и попытаться в них тоже выделить сегменты. Понять, не задает ли эта группа однотипные вопросы, чтобы уменьшить серую зону.

Я провел анализ, сегментировал клиентов и понял, что большая часть — неизвестные для страховой люди. Теперь предстояло выяснить, что делать с такими клиентами. В итоге поняли, что текущей информации недостаточно и надо собирать ее из других каналов. Решили обогатить методы информацией и на ее основе доучить Smart-маршрутизацию, чтобы выделить новые сегменты.

После стажировки я прошел собеседование в команду страхования как технолог. Сейчас занимаюсь маршрутизацией обращений в страховую. Придумываю, как можно превентивно определить, по каким вопросам звонит клиент.

Предсказание LTV клиента

Петр

ВШЭ, 4 курс, факультет математики

Я начал стажироваться в феврале этого года в команде продуктовой аналитики таргета. Мы занимаемся привлечением клиентов в раздел кэшбэков.

На старте мне предложили выбор из шести проектов. Я остановился на задаче предсказать, сколько клиент получит кэшбэка от магазинов (мерчантов), мы это называем LTV (lifetime value) клиента. Задача нужна была для того, чтобы оптимизировать траты на привлечение клиентов в раздел кэшбэка. Предсказание нужно было сделать для клиентов, пришедших месяц назад, на как можно более долгий срок, но в первой итерации договорились, что прогноз сделаю на ближайшие 11 месяцев.

Для того чтобы решить задачу, мне нужно было:

  1. Понять ключевую метрику, по которой будем смотреть качество. Остановились на MAE — этот средняя абсолютная ошибка.
  2. В первом приближении взять в качестве предсказания среднее значение LTV на тренировочной выборке.
  3. Собрать и обработать данные о клиентах (пол, траты, статистики). Первые несколько недель я собирал все возможные данные.
  4. Выбрать признаки для модели. Я обрезал данные, стандартизировал признаки, чтобы уменьшить размерность пространства признаков. Выбрал только 100 признаков, чтобы сократить время отработки модели. Потом проверил без обрезания признаков и убедился, что модель не становится точнее, значит, все сделал верно.
  5. Подобрать модель для предсказания. Я попробовал линейную регрессию и модели классификации, чтобы отфильтровать нули, но эти методы не дали хороших результатов. В итоге лучше всего сработал CatBoost. Результат приемлемый — средняя ошибка стала в 4 раза меньше в сравнении с бейзлайном.
  6. Составить регламентный ноутбук, который будет обновлять базу раз в неделю.
  7. Оформить отчет о проекте на Wiki в конце стажировки.

У меня была еще небольшая задачка в середине стажировки. Нужно было найти регионы, в которые отделу кэшбэков нужно проникнуть лучше. Я искал те регионы, где обороты высокие, а количество мерчантов, которое есть в таргете, низкое. Сейчас вернулся к задаче и обнаружил там подводные камни. У продавцов не всегда корректно поставлены регионы.

Сейчас я работаю в штате и решаю исследовательские задачи: ищу причины расхождения в данных, настраиваю регулярные отчеты. Одна из моих задач — разработать инструмент для определения, насколько полно мы покрываем корзину клиента кэшбэком. Наша цель — покрывать 100% покупок наших клиентов кэшбэком. Мы умели отслеживать, за какие покупки он точно получил. Теперь мы решили отслеживать, за какие покупки он еще мог потенциально получить, чтобы видеть, сколько потребностей для клиента мы покрываем.


Екатерина Карпова после школы начала учиться на стоматолога, но бросила медицину и стала искать подходящую профессию. Сейчас она работает младшим маркетинговым аналитиком в «Тинькофф» и рассказывает, как заинтересовалась аналитикой данных и искала работу на спор.

? Читайте до конца: Екатерина рассказывает, зачем общаться с профессионалами из своей сферы.


Екатерина Карпова, 26 лет
Образование: Московский государственный институт культуры, звукорежиссер
Предыдущее место работы: «Онэлия»
Старая профессия: специалист по актуализации данных
Новое место работы: «Тинькофф»
Новая профессия: младший маркетинговый аналитик

Как я заинтересовалась данными

В школьные годы я училась в физико-математическом классе, участвовала в олимпиадах по математике. Я всегда любила цифры, но в девятом классе я поссорилась с учительницей и перешла в химико-биологический класс. Мои родители — медики, поэтому после школы я решила пойти в медицину и стать стоматологом.

Я даже смогла поступить на бюджет, но на втором курсе поняла, что мне эта сфера не нравится. Сначала родители были против моего ухода из вуза и разрешили мне бросить учебу только на третьем курсе.

Тогда я вернулась к своему детскому увлечению музыкой. Хотела учиться играть на ударных инструментах, но, когда готовилась к поступлению, все музыканты говорили, как круто быть звукорежиссером. В итоге я пошла учиться на него.

Уже на первом курсе я стала работать, немного оторвалась от учебной программы и потеряла интерес. Мне нравилась музыка, но я осознала, что не хочу делать ее работой. Поэтому начиная со второго курса я стала искать то, что мне по-настоящему интересно.

Я вспомнила о своей любви к цифрам и детской мечте стать банкиром, поэтому параллельно стала учиться бухучету. Обучение длилось один год. Это было уже близко к тому, что я хочу, но скучно.

Как я нашла первую работу, связанную с аналитикой

В начале четвертого курса я попала на курс по SQL, и мне очень понравилось. Я увлеклась аналитикой, стала искать информацию, чтобы углубить знания. Наконец я поняла, что область, в которой хочу работать, — это финтех.

Летом после четвертого курса я попыталась попасть в банк, чтобы получить хоть какой-то опыт. Для меня не было принципиально, какая должность у меня будет, лишь бы попасть в эту сферу. Я устроилась консультантом в онлайн-чате в «Тинькофф» и проработала там год и пять дней. Мне нравилась эта работа, но я уставала от постоянного взаимодействия с людьми. Например, когда приходили клиенты с долгами по кредитке, то иногда они очень нервно общались, приходилось их успокаивать.


После этого я стала пытаться пробиться в аналитику. Устроилась в небольшую компанию «Онэлия», которая занимается разработкой IT-решений для разных отраслей. Меня взяли специалистом по актуализации данных. Это была еще не аналитика, но уже работа с данными.

Работала я на проекте разработки сайта для РЖД, отвечала за актуальность информации. Когда вводишь на сайте пункты отправления и прибытия, должен подбираться нужный транспорт. Я делала базу данных для составления маршрутов: искала координаты населенных пунктов на разных картах в интернете, указывала маршруты автобусов, самолетов, поездов.

В основном это была ручная рутинная работа. Но иногда я что-то автоматизировала, занималась чисткой данных, корректировала ошибки, общалась с поставщиками информации. У нас были, например, «автобусники», которые часто открывали новые маршруты, и я уточняла новые остановки.

Я пришла туда, чтобы получить опыт работы с данными. На этой работе мне было спокойно. Кроме того, я могла совмещать ее с обучением, чтобы развиваться и готовиться стать полноценным аналитиком. Но мне хотелось больше свободы, экспериментов, работы с Python! Пыталась заниматься сама и думала, что смогу сменить область за счет самообразования, но не получилось. Поэтому летом 2020 года я поступила в SkillFactory на курс по аналитике данных, чтобы структурировать свои знания и получить сертификат.

Освойте необходимые навыки и инструменты (Google Sheets, SQL, Python, Power BI, математическую статистику) и пройдите через все этапы работы над аналитическим проектом.

Дополнительная скидка 5% по промокоду BLOG.

Зачем я откликалась на вакансии каждый день

В конце 2020 года я стала рассылать резюме. Увидела одну вакансию в Telegram, написала рекрутеру в личку. Она мне резко ответила, что «люди с курсов ничего не умеют» и что она даже рассматривать меня не будет. Я сильно расстроилась и даже дополнительно записалась на профессиональную переподготовку по аналитике данных в НИУ ВШЭ.

Затем было еще много отказов, это было тяжело. Моя подруга хотела заниматься спортом, и мы придумали, как друг друга поддержать.

Мы заключили пари: я должна была каждый день откликаться хотя бы на одну вакансию, а подруга — присылать мне фото с тренировки. Если не выполняешь хотя бы раз, то платишь другому штраф 50 рублей. Мы взяли этот метод из книги «Экстремальный тайм-менеджмент».


Половина работодателей мне отказали. Возможно, причиной отказа было то, что я не всегда откликалась на релевантные позиции. Я хотела получить опыт прохождения собеседований, заведомо зная, что там требуется больше, чем я знаю и умею. Был случай, когда я устроила работодателя, но мы не сошлись по зарплате.

Как я получила работу в «Тинькофф»

Я изначально хотела работать в «Тинькофф», так как у меня уже был опыт работы в этой компании. Но попасть в банк никак не получалось, так что я начала искать работу в других местах. В начале февраля я прошла три успешных собеседования, и меня позвали на работу в Skyeng. Я почти была готова согласиться, и тут в «Тинькофф» нашли мое резюме и спросили, хочу ли я у них работать.

Я честно сказала, что у меня на руках оффер, но если они быстро проведут собеседование, то я готова рассмотреть предложение. До сих пор благодарна HR, которые ради меня всего за неделю провели три собеседования.

На первом этапе нужно было решить математические задачки, на втором я общалась с несколькими тимлидами. Они гоняли меня по теории вероятностей, математической статистике и логике. Задавали вопросы вроде «Сколько апельсинов поместится в автобус?».

На третьем этапе нужно было за час выполнить одну бизнес-задачу вместе с тимлидом и командой. Я успешно прошла все испытания, и меня выбрали сразу два тимлида: из команды кросс-продаж и команды маркетинга. Я выбрала маркетинг.

Что я делаю сейчас

Половина времени уходит на работу в SQL, отчеты и рассылки. А вторую часть времени я общаюсь с внутренними заказчиками — мы обсуждаем, как реализовать задачу, когда и в каком объеме.


Через 2–3 года мне бы хотелось дорасти до руководителя — сначала команды, а потом, может быть, и отдела. Если говорить о горизонтальном росте, то в будущем я бы хотела попробовать себя на другом проекте, например перейти в продуктовую аналитику. У нас есть возможность менять проекты, если сотрудник хочет развиваться.

Получите крепкую аналитическую базу и научитесь общаться с бизнесом на примере реальных кейсов. Дополнительная скидка по промокоду BLOG 5%

Советы

Очень важно общаться с людьми, которые уже работают в интересующей вас области. Иногда полезные знакомства заводятся сами собой. Однажды я смотрела онлайн-лекцию по аналитике, и в комментариях один парень написал, что он работает аналитиком в «Тинькофф» и что к нему можно обращаться с вопросами. Я ему написала, и мы подружились!

Он мне скидывал математические задачки, статьи по аналитике. Впервые увиделись мы, уже когда меня приняли на работу в «Тинькофф». Поэтому посоветую окружить себя людьми из профессии, так вы будете быстрее расти.

Еще я придерживаюсь такого принципа: нужно заниматься тем, что тебе приносит удовольствие. Если ты чувствуешь, что тебе от этого кайфово, то продолжай заниматься. Кто-нибудь это обязательно заметит.

Подходит ли вам профессия маркетолога-аналитика?

Узнайте, сможете ли вы освоить это направление и насколько оно вам нужно. В конце приготовили для вас подарок!

Автор статьи

Куприянов Денис Юрьевич

Куприянов Денис Юрьевич

Юрист частного права

Страница автора

Читайте также: