Data Fest³

September 10-11 2016
Москва, Россия
View
To favorites

Константин Воронцов

Эксперт группы исследований at Яндекс

Вадим Стрижов

Ведущий научный сотрудник at Вычислительный центр РАН

Иван Оселедец

Доктор физико-математических наук, доцент at Сколковский институт науки и технологий

Дмитрий Ветров

Профессор-исследователь at Факультета компьютерных наук НИУ ВШЭ

Евгений Соколов

Руководитель группы качества рекомендаций и анализа контента at Яндекс

About event

Topic: IT

Data Fest — это:

  • Двухдневная программа из лекций, дискуссий и разборов кейсов.
  • Больше 30 докладчиков, рассказывающих о передовых исследованиях и разработках.
  • Темы от теории глубокого обучения до практики применения анализа данных в реальных проектах.
  • Отличная компания и общение с людьми, работающими в области data science.

Audience

  • CIO
  • Разработчика
  • Аналитикам
  • Программистам
  • Студентам технических ВУЗов
Share

Schedule

Show all
 
Get access to all talks
Purchased
In cart
Free
Free
Free
Free
Free
Free

Константин Воронцов

Эксперт группы исследований at Яндекс

Тематическое моделирование на пути к разведочному информационному поиску

Технологии информационного поиска сделали научные знания доступнее. Их стало легче найти, но это не означает, что в них стало легче разобраться. Поиск ответа на вопрос «Где находится передний край науки по данной теме?» по-прежнему требует массы времени, высокой квалификации и достигается в значительной степени путём личного общения. Поисковые системы следующего поколения продолжат устранять барьеры между человеком и знанием, автоматизируя процессы систематизации и усвоения информации. В докладе рассматриваются методы и технологии анализа текстов, лежащие в основе тематического разведочного поиска.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Вадим Стрижов

Ведущий научный сотрудник at Вычислительный центр РАН

Порождение и выбор моделей машинного обучения

Для решения задач распознавания, классификации и прогнозирования нужна модель, которая допускает минимум ошибок и работает устойчиво. Перебор моделей требует от инженера значительных усилий. Предлагаемый метод помогает систематизировать такую работу. Его цель — автоматическое построение оптимальной модели. В докладе будет рассмотрено применение метода к анализу сигналов интернета вещей.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Иван Оселедец

Доктор физико-математических наук, доцент at Сколковский институт науки и технологий

Тензорные разложения и их применения

Матричные разложения лежат в основе многих методов обработки данных и машинного обучения. Переход от матриц к многомерным массивам (тензорам) естественным образом приводит к задачам разложения тензоров, которые обладают принципиально новыми свойствами. В докладе будет обзор существующих тензорных методов и примеры практического применения таких подходов, в том числе в задачах глубинного обучения.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Дмитрий Ветров

Профессор-исследователь at Факультета компьютерных наук НИУ ВШЭ
and 6 more
speakers

Панельная дискуссия «Обучение machine learning»

Участники панельной дискуссии поделятся опытом создания образовательных программ по машинному обучению в вузах, на курсах и в онлайне.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Максим Борисяк

Стажёр-разработчик at Яндекс

CRAYFIS: поиск космических лучей ультравысоких энергий с помощью мобильных устройств

Космические лучи ультравысоких энергий до сих пор остаются загадкой для астрофизиков. Цель эксперимента CRAYFIS — разгадать тайну их возникновения. С помощью машинного обучения смартфоны добровольцев превратятся в глобальную обсерваторию, наблюдающую за этим редким космическим явлением.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Иван Дрокин

Аналитик at ЗАО «Биокад»

Машинное обучение в анализе медицинских данных

Современная медицина накопила огромный объём информации о пациентах и развитии заболеваний. Появилось множество методов диагностики и исследований — от анализа крови до генетических тестов, от ЭКГ и УЗИ до компьютерной томографии. В докладе речь пойдёт о нескольких приложениях машинного обучения к анализу медицинских данных. Кто лучше диагностирует рак — человек или машина? Можно ли предсказать сердечную недостаточность за девять месяцев до её проявления?

Purchased
In cart
Free
Free
Free
Free
Free
Free

Илья Захаров

Научный сотрудник лаборатории возрастной психогенетики at Психологический институт РАО

Исследование связности в мозге на основе электрофизиологических данных

Анализ сетей передачи информации в мозге (связности мозга или connectivity) стал ступенькой для более целостного понимания принципов работы одного из сложнейших устройств в природе. В докладе пойдёт речь о том, на каких уровнях можно анализировать сети в мозге, какие данные для этого нужны, какие подводные камни могут возникать при таком анализе. А главное — что нового позволили узнать такие исследования.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Дмитрий Ветров

Профессор-исследователь at Факультета компьютерных наук НИУ ВШЭ

Нейробайесовский подход к задачам машинного обучения

В последние два года происходит стремительная конвергенция двух популярных подходов к решению задач машинного обучения. Это стало возможным после появления масштабируемых техник вариационного байесовского вывода. В докладе мы рассмотрим основы байесовского подхода и обсудим, какие преимущества он дает нейронным сетям.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Сергей Бартунов

Старший преподаватель at ФКН НИУ ВШЭ

Глубокое обучение: деконструкция мифа

Что именно позволило нейросетям из технологии-аутсайдера превратиться в предпочтительный инструмент для анализа сенсорной информации (а также всего остального)? Может ли другая технология в ближайшем будущем заменить глубокое обучение? Где и когда можно ждать следующего технологического прорыва? В докладе попробуем ответить на эти и некоторые другие вопросы.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Виктор Лемпицкий

Аналитик at Яндекс

Синтез изображений с помощью глубоких нейросетей

Использование глубоких свёрточных нейросетей в задачах распознавания образов на изображениях стало популярной и общеизвестной технологией. Что интересно, в последние два года исследователи предложили варианты использования таких нейросетей «в обратном направлении», т. е. для создания изображений, обладающих определёнными свойствами. Я расскажу о некоторых результатах, полученных буквально только что — в последние месяцы.

Purchased
In cart
Free
Free
Free
Free
Free
Free
Get access to all talks
Purchased
In cart
Free
Free
Free
Free
Free
Free

Игорь Лифарь

Руководитель группы ранжирования at Яндекс
and 1 more
speaker

Рекомендательная система сервиса Яндекс.Дзен

Команда Яндекс.Дзена расскажет о том, как строятся рекомендации, которыми ежедневно пользуются несколько миллионов человек из более чем 40 стран мира. Отдельное внимание будет уделено техникам работы с текстами, применению нейронных сетей (в том числе глубоких), коллаборативной фильтрации, а также связи между офлайн- и онлайн-метриками качества.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Георгий Иванов

Аналитик at Mail.Ru

Использование кликовых данных для улучшения исправления опечаток

Обучающее множество для корректора опечаток традиционно собирают с использованием асессоров. Мы реализовали сбор из данных о кликах на страницах результатов поиска по исходному и исправленному запросу. Новый метод требует меньших затрат и даёт результат сопоставимого качества.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Евгений Соколов

Руководитель группы качества рекомендаций и анализа контента at Яндекс

Модели специализированного поиска и поисковый индекс

Доклад посвящён технологии специализированного поиска, которая сейчас активно разрабатывается в Yandex Data Factory. Цель этой технологии — дать возможность пользователям «обучать» свои собственные поисковые движки и ориентировать их не на общую релевантность, а на узкие тематики. Речь пойдёт о примерах применения этой технологии к поиску медицинских статей и обнаружению сайтов, предлагающих потребительские займы.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Алексей Натекин

Лидер at Open Data Science
and 5 more
speakers

Панельный chop shop

Участники дискуссии обсудят, как можно было бы реализовать конкретные проекты — каждый слушатель сможет предложить свою идею.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Виктор Лобачев

Senior Researcher at Skolkovo Institute of Science and Technology

Как Яндекс металлургам помогал

Речь пойдёт о том, как можно применить технологии больших данных в промышленных задачах. Какую модель команда Yandex Data Factory построила для описания производства стали и какая задача оптимизации была решена с помощью этой модели. И, конечно, немного о том, как применить найденный подход к более широкому кругу промышленных задач.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Артур Кадурин

Data Scientist at Mailru Group

Generative Adversarial Nets

Доклад о современной и перспективной архитектуре нейронных сетей, которая уже показала себя неплохо в целом ряде задач на supervised learning и unsupervised learning.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Александр Петров

Директор по технологиям at E-Contenta

Рекомендации с онлайн дообучением

В каких ситуациях дообучение важно и нужно, какие известны подходы и методы, что используется в E-Contenta.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Петр Ромов

Data Scientist at Яндекс

Тренировка по машинному обучению

Традиционный формат: совместный разбор решений задач из онлайн-конкурсов от победителей последних соревнований.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Артур Кузин

Data Scientist at Avito

Тренировка по машинному обучению

Традиционный формат: совместный разбор решений задач из онлайн-конкурсов от победителей последних соревнований.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Даниил Охлопков

Студент факультета радиотехники и кибернетики at МФТИ

Тренировка по машинному обучению

Традиционный формат: совместный разбор решений задач из онлайн-конкурсов от победителей последних соревнований.

Purchased
In cart
Free
Free
Free
Free
Free
Free
Get access to all talks
Purchased
In cart
Free
Free
Free
Free
Free
Free
Purchased
In cart
Free
Free
Free
Free
Free
Free

Алексей Натекин

Лидер at Open Data Science

Коллективные проекты по анализу данных и симулятор козла

Как прокачаться в анализе данных, найти единомышленников и при этом неплохо угаретьоторваться? Организовать проект! Наше сообщество OpenDataScience началось с таких совместных проектов, и мы вновь готовы их запускать. На лекции я расскажу о том, что мы придумали и как к этому присоединиться. От лайтовых небольших исследований алгоритмов, до попыток сделать реальный симулятор козла с много-камерной съемкойсъёмкой и электроэнцефалографом.

Purchased
In cart
Free
Free
Free
Free
Free
Free
Purchased
In cart
Free
Free
Free
Free
Free
Free

Михаил Свешников

Разработчик at Rubbles
and 2 more
speakers

Deep2ch: чатботы в естественной среде обитания.

Многие алгоритмы для генерации текста на выходе дают бессвязную чушь. По крайней мере, так утверждают люди, оценивающие результаты. Эту проблему можно решить, посмотрев на неё с другой стороны: проблема не в алгоритмах, а в людях! Мы расскажем, как родившаяся на «Датасауне» идея генерировать сообщения для slack-чата переросла в эпичнейшую битву чатботов на просторах Двача. Этот проект начался как прикол, но в итоге позволил нам ответить на важные вопросы. Поймут ли люди, что пост написал робот, если он написан в /b? Как оценить, какой из алгоритмов больше похож на человека? Кто из собеседников-людей скорее просто подвыпил, а кто строчит прямиком из «жёлтого дома»?

Purchased
In cart
Free
Free
Free
Free
Free
Free

Ирина Голощапова

Эксперт по анализу денежно-кредитной политики at Центр макроэкономического анализа и краткосрочного прогнозирования

Совмещение R и Python. Зачем, когда и как

Обсудим основные цели и способы совмещения языков R и Python. Посмотрим на примеры кода. В конце разберём небольшую реальную задачу.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Вадим Смахтин

Сооснователь at Mathrioshka

Инструменты и методологии для визуального анализа пространственно-временных данных

Речь пойдёт об альтернативных методах визуализации и анализа городских процессов и их онлайн-отражений. Конкретные примеры могут быть самые разные — перемещения людей по улицам, упоминания городского события в соцсетях и т. д. Посмотрим, как тут помогают инструменты, разрабатываемые в Habidatum.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Петр Ермаков

Data Scientist at HeadHunter

Аренда облачных мощностей для начинающих, или Краткий гайд о том, что и для чего выбирать

В докладе я расскажу о существующих облачных сервисах, которые можно использовать для анализа данных (Amazon Web Services, Microsoft Azure, Heizner Online и др.) Мы поговорим о преимуществах того или иного сервиса при решении задач разных типов. В завершение доклада я планирую поделиться опытом оптимизации и упрощения работы с такими сервисами и обсудить перспективы их использования.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Фёдор Ратников

Исследователь данных at Яндекс

Большие данные Большого адронного коллайдера

В результате физических экспериментов на Большом адронном коллайдере данные производятся со скоростью около 100 Гбит/с на протяжении вот уже четырёх лет. Зачем столько данных? Как их собрать и сохранить, где обработать? Что получается на выходе?

Purchased
In cart
Free
Free
Free
Free
Free
Free

Дмитрий Бабаев

Эксперт по наукам о данных at МТС

ML Pipelines: Spark 2.0 vs Scikit-Learn

Расскажу о применениии Spark для машинного обучения, о различиях между Spark MLLib и популярной Python-библиотекой Scikit-Learn.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Наталья Притыковская

Исследователь данных at Одноклассники

Apache Zeppelin: интерактивный анализ больших данных

Мы рассмотрим технологию Apache Zeppelin, которая упрощает интерактивный анализ больших объёмов данных, выполняя ту же роль, что и IPython или Jupiter Notebook в экосистеме Python. Помимо удобного веб-интефейса, соединённого с Apache Spark и другими технологиями Hadoop Stack, Zeppelin предоставляет гибкие инструменты построения интерактивных визуализаций на базе AngularJS, что существенно расширяет возможности исследователя. Стоит упомянуть и интеграцию Zeppelin со Spark Streaming, позволяющую проводить анализ данных, поступающих с сервиса в реальном времени. Функциональность Zeppelin мы продемонстрируем на примере реальных задач аналитики «Одноклассников».

Purchased
In cart
Free
Free
Free
Free
Free
Free
Get access to all talks
Purchased
In cart
Free
Free
Free
Free
Free
Free

Иван Ямщиков

Аналитик at Яндекс

Питч-сессия

Purchased
In cart
Free
Free
Free
Free
Free
Free

Анатолий Марин

CEO/Co-Founder at Payment Systems
and 1 more
speaker

How to build a defensible business in machine learning

Почти все крупные бизнесы используют сетевой эффект. Он помогает удерживать позиции и увеличивать маржу. Мы поговорим о том, как создать такой эффект в бизнесе, связанном с машинным обучением.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Виктор Осыка

Инвестор at Almaz Capital

Creating a deep learning startup

Who can help the daring build a great deep learning company, and how.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Владислав Беляев

Генеральный директор at DeepHackLab

How to launch a deep learning startup and avoid failure. Technology vs. Product

Технологии машинного интеллекта и анализа данных сейчас у всех на слуху. Новые разработки, библиотеки и сервисы появляются каждые несколько недель. С одной стороны, это открывает двери и мотивирует создавать интересные продукты, но с другой — заказчики и рынок зачастую хотят космос, который нам пока только снится. В докладе будет освещено, как взаимодействовать со всеми причастными — от инвесторов до разработчиков — на пути развития научно-технологического стартапа в области машинного интеллекта.

Purchased
In cart
Free
Free
Free
Free
Free
Free

Tickets

Video
Access to all videos
Purchased
In cart
Free
Free
Free
Free
Free
Free

Organizer

Яндекс
http://fronttalks.ru/

Organizer committee: Open Data Science, 1

Similar events

May 19 2018
Talks 18
Views 8.04 K
bigdata, аналитика, данные, датасеты, программирование, разработка, технологии
November 21 2017
Talks 3
Views 879
аналитика, аналитика, аналитика, безопасность, данные, интернет реклама, клиенты, медийная реклама, наружная реклама, офлайн, продвижение, реклама
May 13 2017
Talks 9
Views 5.36 K
аналитика, данные, программирование, разработка
more