Пользователи Яндекса получили инструмент для управления своими данными
Интернет, 1 июня 2021 года. В личном кабинете Яндекс ID появился инструмент для управления данными. С его помощью пользователи могут запросить архив с информацией, которую накопили о них разные сервисы Яндекса, а также удалить свои данные из отдельных сервисов. Например, можно стереть историю запросов к Алисе или сведения о посещённых местах.
Архив включает информацию из более чем 50 сервисов Яндекса. На его подготовку нужно несколько дней. Когда всё готово, на почту приходит письмо, а файл с архивом появляется в Яндекс ID. Удалить данные сейчас можно из Алисы, Музыки, Карт, Почты, Диска, Дзена, Переводчика, Погоды, Мессенджера, Бизнеса и Станции. До конца года в список войдут все основные сервисы Яндекса.
Бóльшая часть данных стирается с серверов в течение суток. Некоторые данные по закону нужно хранить определённое время — их Яндекс перестаёт обрабатывать сразу после поступления запроса и удаляет, как только истечёт установленный срок. Данные, которые являются частью сервиса, например правки и панорамы в Картах, нельзя удалить полностью. Они обезличиваются — Яндекс стирает информацию о том, кто их добавил.
Иван Черевко,
директор Яндекса по защите данных:
Данные о пользователях, их интересах и действиях — лайках и дизлайках, отзывах, поездках и так далее — помогают нам делать удобные и персонализированные сервисы. Яндекс бережно хранит и надёжно защищает эту информацию. При этом мы — за прозрачность: у человека должна быть возможность проверить, что Яндекс знает о нём, и распорядиться этими данными по своему усмотрению.
Удаление данных — необратимый процесс, его нельзя отменить. Если стереть данные, некоторые возможности сервисов Яндекса станут недоступны. К примеру, Музыка советует треки, опираясь на историю прослушиваний, лайки и дизлайки. Без этой информации рекомендации будут неточными.
Инструмент для управления данными — часть Яндекс ID, он находится в разделе «Управление аккаунтом». Чтобы получить доступ к инструменту, нужно ввести код подтверждения — это дополнительная мера безопасности. Код высылается на номер, привязанный к аккаунту.
Яндекс ID — это аккаунт пользователя на Яндексе и центр управления личными данными и настройками. Все данные в Яндекс ID надёжно защищены, что подтверждается независимыми проверками. По их итогам Яндекс второй год подряд получает сертификат соответствия международному стандарту безопасности SOC 2.
Контакты
Пресс-служба компании «Яндекс»
Тел.: +7 (495) 739 7000
E-mail: [email protected]
URL страницы | Содержание — Популярное. | В некоторых браузерах URL страницы может определяться неточно. Это происходит, если браузер задает политику обработки рефереров по умолчанию. Чтобы URL определялся корректно, убедитесь что на вашем сайте политика обработки рефереров задаётся явно. Подробнее о политиках | |
Содержание — Страницы входа. | |||
Содержание — Страницы выхода. | |||
Реферер страницы | Источники — Сайты. | ||
Источники — Поисковые системы. | |||
Источники — Рекламные системы. | |||
Заголовок страницы | Содержание — Заголовки страниц. | ||
Браузер и его версия | Технологии — Браузеры, а также в любом отчете при выборе соответствующей группировки. | ||
Операционная система и ее версия | Технологии — Операционные системы, а также в любом отчете при выборе соответствующей группировки. | ||
Устройство | Технологии — Устройства, а также в любом отчете при выборе соответствующей группировки. | ||
Высота и ширина экрана | Технологии — Разрешения дисплеев, а также в любом отчете при выборе соответствующей группировки. | ||
Наличие Cookies | Технологии — Наличие Cookies, а также в любом отчете при выборе соответствующей группировки. | ||
Наличие JavaScript | Технологии — Наличие JavaScript, а также в любом отчете при выборе соответствующей группировки. | ||
Часовой пояс | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Язык браузера | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Глубина цвета экрана | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Ширина и высота клиентской части окна браузера | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Пол и возраст посетителей | Посетители — «Демография» (пол и возраст), а также в любом отчете при выборе соответствующей группировки. | ||
Интересы посетителей | Посетители — Долгосрочные интересы, а также в любом отчете при выборе соответствующей группировки. | ||
Географические данные | Посетители — География, а также в любом отчете при выборе соответствующей группировки. | ||
JavaScript-события. Учет взаимодействий посетителя с сайтом, в том числе использование на сайте методов JavaScript API. Например, отправка формы, скроллинг страницы | Доступны в любом отчете в виде целей, а также в отчетах: | ||
Параметры загрузки страницы. Например, время до отрисовки и время ответа сервера. | Отчеты группы Мониторинг. | ||
Просмотр страницы | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Визит | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Переход по внешней ссылке | Доступны в любом отчете в виде целей. | ||
Скачивание файла | Доступны в любом отчете в виде целей. | ||
Отказ | Доступны в любом отчете при добавлении соответствующей группировки. | Будет учтен, если зафиксируется не больше одного просмотра страницы за время визита. При этом не учитывается точный показатель отказов. | |
Время на сайте | Доступны в любом отчете при добавлении соответствующей группировки. | ||
Глубина просмотра | Доступны в любом отчете при добавлении соответствующей группировки. |
Компания Яндекс — Раскрытие информации о запросах
Яндекс регулярно получает запросы от органов государственной власти, касающиеся пользовательских данных. Яндекс рассматривает те из них, которые пришли по официальным каналам и соответствуют всем формальным требованиям. В ответ на запрос компания предоставляет ровно столько информации, сколько необходимо для ответа. А если запрос не соответствует требованиям закона, Яндекс его отклоняет. Запросы, пришедшие по неофициальным каналам, например по электронной почте или по телефону, не получают ответа и не учитываются в статистике.
Яндекс бережно хранит и надёжно защищает данные пользователей, а также даёт возможность управлять ими в личном кабинете Яндекс ID. Начиная с 1 июня 2021 года пользователи могут скачать архив с информацией, которую накопили о них разные сервисы Яндекса, и удалить свои данные из отдельных сервисов.
Статистика показывает количество запросов на скачивание и удаление данных в июне 2021 года. Один пользователь мог прислать несколько запросов.
В этом разделе вы найдёте данные, касающиеся обработки заявлений по закону «о праве на забвение». Этот закон обязывает поисковые системы удалять из результатов поиска ссылки на незаконную, недостоверную или неактуальную информацию о заявителе.
В статистике представлено число полученных Яндексом ссылок с каждым из трёх обоснований — неактуальность, недостоверность и нарушение закона, — а также количество и доля отказов. Некоторые ссылки могут иметь больше одного обоснования и учитываться несколько раз, поэтому суммировать число ссылок с разными обоснованиями нельзя. В статистике учитываются только обращения, отправленные в электронном виде, и не учитываются некорректно заполненные заявления.
Ответы на вопросы
— Почему вы вообще должны выдавать сведения о пользователях?Законы стран, в которых работает Яндекс, позволяют государственным органам запрашивать определённые данные и сведения о пользователях Яндекса. Например, в России законы «О полиции», «Об оперативно-розыскной деятельности» и другие нормативные акты определяют, на каком основании и какие данные могут запросить государственные органы и в какие сроки необходимо предоставить ответ.
— Кто может запрашивать данные пользователей ваших сервисов?
В разных странах такими полномочиями могут обладать разные государственные органы, это зависит от местного законодательства. Например, согласно законодательству Российской Федерации, полномочия запрашивать данные и сведения есть у МВД, Следственного комитета, Прокуратуры, ФАС, ФТС, судов и некоторых других органов.
— Какой запрос может считаться обязательным для предоставления ответа?
Яндекс обязан отвечать на все запросы, оформленные в соответствии с требованиями действующего законодательства. Если запрос приходит на бумаге, он должен быть оформлен на официальном бланке ведомства, содержать контакты и собственноручную подпись уполномоченного лица, а в ряде случаев ещё и должен быть заверен оригинальным оттиском печати. Запрос в электронной форме считается обязательным для предоставления ответа только в том случае, если он заверен усиленной квалифицированной электронной подписью.
— Почему вы раскрываете данные не по всем сервисам?
Мы раскрываем данные по тем сервисам и направлениям компании, которые получают наибольшее количество запросов. Кроме того, для большинства сервисов запросы касаются выдачи данных из Яндекс ID, что отражено в статистике.
— В статистике указан Яндекс ID — почему вы его выделяете?
Яндекс ID — это сервис для управления аккаунтом на Яндексе, в нём хранятся основные регистрационные данные пользователя. Очень часто запросы к тому или иному сервису сводятся к предоставлению данных из Яндекс ID. Например, это может быть запрос о пользователе, который использовал один из сервисов Яндекса для мошенничества. Поэтому некоторые сервисы не показываются отдельно, статистика по ним относится к Яндекс ID.
— Правда ли, что вы можете предоставить данные по электронной почте, получив обязательный для ответа запрос?
Нет. Ответы на запросы предоставляются только по официальным каналам связи. Электронная почта к ним не относится, как и, например, телефон или мессенджер.
— Что будет компании за отказ выдать сведения по обязательным для ответа запросам?
Непредоставление сведений по официальным запросам, оформленным и полученным по законным каналам, для любой организации влечёт ответственность в виде штрафа, а в ряде случаев может грозить приостановкой деятельности компании и даже уголовной ответственностью для руководителя.
Согласно нормам законодательства большинства стран, где мы работаем, такую информацию раскрывать запрещено. Например, в России это регулируется ст. 161 Уголовно-процессуального кодекса РФ.
— Доступ к содержимому почтового ящика или переписке в мессенджере тоже предоставляется по запросу?
Нет. Доступ к содержимому почтового ящика или личной переписке предоставляется только по судебному решению, ограничивающему право человека на тайну переписки. Без соответствующего решения суда такие сведения не могут быть выданы.
Яндекс открывает датасеты Беспилотных автомобилей, Погоды и Переводчика, чтобы помочь решить проблему сдвига данных в ML
В рамках конкурса Shifts Challenge мы выкладываем в открытый доступ крупнейший в мире датасет для обучения беспилотных автомобилей, а также данные Яндекс.Переводчика и Погоды. Приглашаем исследователей в области машинного обучения присоединиться к поиску решения проблемы сдвига распределения данных в реальном мире по отношению к тому, с чем моделям приходится иметь дело при обучении.
Меня зовут Андрей Малинин, я старший исследователь в Yandex Research. Сегодня я расскажу о проблеме, о наших датасетах, а также о конкурсе, который мы проводим в рамках международной конференции NeurIPS 2021 совместно с учеными из Оксфордского и Кембриджского университетов.
Сдвиг распределения данных
Чтобы разработать модель, обычно используются три выборки данных: обучающая, отладочная и проверочная (те данные, с которыми модели придется работать в реальном мире). Считается, что эти три выборки, с одной стороны, независимы друг от друга (данные, например, в отладочной и проверочной выборках не должны пересекаться), а во-вторых, имеют одинаковое распределение. Исходя из этого, можно предположить, что модель, которая хорошо работает на отладочных данных, хорошо будет вести себя и в реальном мире — так как данные, пусть и разные, распределены одинаково.
К сожалению, в реальном мире все намного сложнее: разрабатывая модель, мы не можем наперед просчитать все ситуации, в которые она попадет. Наша модель в любой момент может столкнуться с так называемым сдвигом распределения (англ. distributional shift) — то есть ситуации, в которые она попадет, будут ей незнакомы просто потому, что она никогда не видела таких данных и не знает, как себя вести.
Если сдвиг распределения данных в реальном мире значителен относительно обучающей выборки (например, модель машинного перевода, которая училась на классической литературе, вдруг возьмется переводить твиты), недостаточно надежные модели будут ошибаться. Поэтому, попадая в реальный мир, модели должны быть готовы справляться со сдвигом, который их там ждет.
Этим, однако, дело не ограничивается. Чтобы модель работала эффективно и безошибочно, о вероятности ошибки лучше знать заранее: следовательно, модель должна давать оценку неопределенности относительно своих решений. Поэтому мы хотим добиться от моделей, с одной стороны, устойчивой работы при сдвиге распределения, а с другой — умения оценивать неопределенность.
Сейчас большинство исследований, посвященных устойчивости к сдвигу распределения и неопределенности, нацелены на решение задачи классификации изображений. Задача эта, безусловно, очень важна, но в масштабных промышленных проектах, помимо классификации изображений, есть и другие — включая те, в которых влияние ошибок, вызванных сдвигами распределения, может быть довольно значительным.
Shifts Challenge
Мы хотим помочь ML-сообществу преодолеть разрыв между исследованиями и технологиями в реальном мире, поэтому объявляем о соревнованиях Shifts Challenge, которые проводим вместе с Оксфордским и Кембриджским университетами в рамках конференции NeurIPS 2021.
Цель соревнования — повысить осведомленность сообщества о влиянии сдвигов распределения данных на работу моделей, разработать модели, устойчивые к сдвигам, а также научиться определять сдвиги, оценивая степень неопределенности в прогнозах.
В конкурсе три трека, для которых мы подготовили датасеты из разных сфер применения моделей: прогнозирования погоды, машинного перевода и предсказания участников движения на дороге.
Конкурс проводится в два этапа:
Первый этап, с 16 июля по 17 октября. Мы публикуем обучающий и отладочный датасеты. Участники разрабатывают модели и загружают их на отладочный лидерборд.
Второй этап, с 17 октября по 31 октября. Мы публикуем проверочную выборку. У участников есть две недели, чтобы настроить модели и загрузить их предсказания на сайт. Все результаты появятся в проверочном лидерборде.
После этого мы в течение месяца будем проверять решения участников, а 30 ноября объявим победителей: участники, занявшие призовые места, получат денежные призы.
А теперь подробнее расскажу о треках.
Предсказание траекторий движения
Проблема прогнозирования движения — одна из самых важных в сфере автономного вождения: беспилотному автомобилю, как и любому другому, требуется время на изменение скорости и направления. Чтобы обеспечить безопасную и комфортную поездку, модуль планирования должен предсказывать, где окажутся другие автомобили и прочие участники движения (например, пешеходы), на несколько секунд вперед.
Большинство компаний, разрабатывающих беспилотные автомобили, тестируют свои технологии в одной или нескольких локациях. Мир при этом невероятно разнообразен, и в новых городах или странах автомобили будут встречаться с абсолютно новыми для себя условиями движения, будь то другая погода или различия в ПДД. Кроме того, даже в очень похожих ситуациях манера вождения в разных странах может отличаться. Например, в Тель-Авиве водители чаще торопятся въехать на круговой перекресток, а в Иннополисе наоборот спешат выехать с него.
Поэтому очень важно научить беспилотный транспорт применять в новых для него местах как можно больше накопленных знаний и опыта — то есть справляться с тем самым сдвигом распределения. Другими словами, беспилотный автомобиль, который учился ездить безоблачным летом, должен справиться с поездкой по заснеженным дорогам.
В рамках этого трека мы публикуем крупнейший в мире датасет прогнозирования движения транспортных средств. Он собран разработчиками беспилотных автомобилей Яндекса и содержит 600 тысяч размеченных сцен (это более 1600 часов вождения): в датасет вошли поездки беспилотников по городам России, США и Израиля в самую разную погоду — от безоблачного ясного дня до заснеженной ветреной ночи. Суть задания в этом треке: спрогнозировать для каждого транспортного средства 5-секундные траектории движения, а также выдать понятную метрику неопределенности прогноза.
Машинный перевод
Сервисы машинного перевода, такие как Яндекс.Переводчик, часто сталкиваются с нетипичным и необычным использованием языка, включая сленг, ненормативную лексику, плохую грамматику, орфографические и пунктуационные ошибки, а также эмодзи — язык, а особенно повседневный онлайн-вариант, все же достаточно живой. Для современных моделей, которые используются в машинном переводе, такой язык представляет серьезную проблему, так как большинство переводчиков обучаются на чуть более формальном языке: классической литературе, юридических документах или статьях Википедии.
Для качественного машинного перевода важно, чтобы модели были устойчивы к нестандартной лексике и ошибкам и в любом случае выдавали качественный перевод — даже если перевести нужно фразу из мема.
В треке перевода мы использовали для обучения англо-русский корпус WMT’20, который в основном состоит из государственных и новостных текстов. В них мало ошибок, язык формальный — именно на таких «стерильных» текстах обучаются многие системы машинного перевода.
Данные для отладки и проверки модели состоят из двух частей: со сдвигом и без. Данные без сдвига взяты из англо-русского корпуса Newstest’19, а также из корпуса новостных текстов, собранных службой Global Voices и переведенных Яндексом. Данные со сдвигом для отладки взяты из подготовленного для WMT Robustness Challenge корпуса Reddit и также переведены Яндексом. Для проверки модели на данных со сдвигом мы также собрали, перевели и разметили дополнительные данные с Reddit.
Задача модели — перевести предложение с исходного языка на целевой. Важно, чтобы модель была устойчива к неформальному и нетипичному использованию языка, обеспечивала высокое качества перевода на выборках со сдвигом распределения и указывала высокую степень неопределенности на тех примерах, на которых она ошибается.
Предсказание погоды
Составление прогноза погоды с помощью моделей — тоже задача нетривиальная. Во-первых, данные по климатическим зонам могут быть нерепрезентативны: где-то метеостанций больше, где-то — меньше. Кроме того, климатические процессы довольно нестационарны (другими словами, климат весьма изменчив). Поэтому даже самые качественные модели предсказания погоды могут со временем стать неактуальными и давать неправильные прогнозы.
Для трека предсказания погоды мы предоставляем участникам данные, собранные командой Яндекс.Погоды. Они табличные, каждый временной отрезок соотнесен с разными климатическими характеристиками: показателями атмосферного давления, влажности, измерениями ожидаемой температуры на определенной широте и долготе и так далее — всего 111 характеристик.
Участникам трека нужно разработать модель, предсказывающую измеренную метеостанцией температуру на определенной широте и долготе в определенный момент времени с учетом всех доступных измерений и прогнозов. Модель должна быть устойчива к сдвигам по времени и климатическим зонам, а также указывать высокую степень неопределенности на примерах, на которых она ошибается.
Как начать
Подробные условия, тайминг и описания доступных датасетов можно найти
на сайте конкурса. Детали датасетов, метрик оценки и бенчмарков есть в нашей
статье.
Ссылки на данные доступны в нашем репозитории на GitHub. Чтобы помочь вам начать работу, мы загрузили туда примеры и сделали базовые модели доступными для скачивания.
Призываем участников челленджа присоединиться к нашему сообществу в Slack — там можно задавать вопросы организаторам и дискутировать с другими участниками.
Мы надеемся, что NeurIPS 2021 Shifts Challenge приблизит нас к пониманию того, как модели могут предсказывать неопределенность, работать со сдвигами распределения в данных, и как следствие — к более надежным и безопасным технологиям.
«Яндекс» раскрыл, как часто выдает властям данные пользователей. Спойлер: не так уж редко
«Яндекс» опубликовал информацию о статистике раскрытии данных пользователей по запросам российских властей. Цифры приведены на официальном сайте компании, а разделе «Конфиденциальность ваших данных».
Согласно официальной информации, с января по июнь 2021 года в «Яндекс» поступило 19650 запросов от властей на выдачу персональных данных пользователей. Компания для наглядности разбила это количество на отдельные сервисы — на графике можно увидеть, как часто органы власти запрашивают данные тех или иных сервисов.
Например, чаще всего правоохранителям требуется информация из «Такси» — за полгода «Яндекс» получил 8583 таких запроса. 6288 из них он удовлетворил, предоставив информацию о пользователе «Такси», а на 2295 ответил отказом.
На втором месте по популярности у властей находится «Почта» — ею заинтересовались 6445 раз за полгода. «Яндекс» выдал информацию по 5783 запросам, и отказал в 662 случаях.
Меньше всего правоохранителей интересуют данные пользователей медиасервисов, таких, как «Музыка» или «Кинопоиск» — на их выдачу было всего 70 запросов, 23 из которых не были удовлетворены.
Если объединить все эти данные в одну статистику, то получается, что «Яндекс» выдает данные своих пользователей примерно в 79% случаев, а отказывает в выдаче — в 21%.
Стоит отметить, что само по себе количество запросов к «Яндексу» выросло. В период с января по июнь 2020 года власти запрашивали данные россиян у компании 15376 раз, а с июля по декабрь 2020-го — 16874 раза. При этом они получали отказы в 16% и 22% случаев соответственно.
«Яндекс» поясняет, что в статистику входят только те запросы, которые оформлены по всем правилам и соответствуют законодательству. Просьбы, поступающие в каком-то ином виде, сразу отклоняются, и не попадают в общий учёт.
Ранее мы рассказали, что Роскомнадзор заблокировал еще шесть популярных VPN-сервиса. Кроме того, стало известно, что Apple решила отложить запуск своего механизма «детской защиты».
«Яндекс» объяснил утечку данных пользователей
«Яндекс» возложил ответственность за появление в поисковой выдаче сканов паспортов, билетов и платежных квитанций на владельцев сайтов, передал «Коммерсантъ».
Утечку персональной информации обнаружил накануне SEO-специалист Павел Медведев. Оказалось, что в «Яндексе» можно найти личные данные с сайтов Сбербанка, ВТБ, дептранса Москвы и агрегаторов билетов.
По словам представителя «Яндекса», алгоритмы поисковика проиндексировали файлы, потому что владельцы сайтов не позаботились об их безопасности. Сбербанк заверил, что начал разбирательство.
Утечка данных клиентов произошла из-за небрежности сотрудников компаний, пояснил Performance360 основатель компании Б-152, эксперт в области защиты персональных данных Максим Лагутин.
«Поисковый робот «Яндекса» находит все, что владелец сайта указал для индексирования. Для поисковика достаточно сложно анализировать информацию на предмет наличия персональных данных, тем более это может накладывать на «Яндекс» обязательства оператора этих персональных данных. Поэтому проблема в сайтах», — объяснил он.
Большинство утечек, исходя из информации в СМИ, идет со стороны госорганов и госкомпаний. Основные причины — незнание или «человеческий фактор». Когда сотрудники неправильно настроили файл ограничения индексации robots.txt. По мнению Лагутина, нужно штрафовать компании, допустившие утечку и обязать их принять меры.
«Желательно, чтобы в компании был специалист по безопасности или хотя бы ответственный за сайт, который бы это проконтролировал настройку этого файла. Специалисты по поддержке сайта должны понимать ответственность, все-таки живем во время достаточно строгих законов о защите данных, 152-ФЗ, Европейский GDPR. Рекомендую не полениться и проверить, как настроен файл robots.txt, пока не были принты поправки о штрафах за утечку персональных данных», — подчеркнул Лагутин.
Интерес к вопросу хранения персональных данных возрос на фоне утечки файлов Google Docs. «Думаю, если еще в «Яндексе» покопаться, можно узнать еще много чего интересного», — заключил Лагутин.
Ранее в поисковой выдаче «Яндекса» оказались файлы Google Docs с конфиденциальной информацией. Утечка отразилась на репутации Тинькофф Банка. Общедоступной оказалась инструкция от одного из сотрудников о запрете принимать на работу уроженцев Кавказа, представителей ЛГБТ и глубоко верующих людей.
«Яндекс» оперативно убрал возможность индексации Google Docs. Google заявил, что виноваты сами пользователей, которые не защитили данные настройками приватности.
«Яндекс» опубликовал данные беспилотников для конкурса Shifts Challenge
Задача конкурса — привлечь внимание к проблеме «сдвига данных» в машинном обучении. Для его участников «Яндекс» открыл массив данных, который содержит более 1600 часов движения размеченных фрагментов поездок на дорогах России, Израиля и США в хорошую погоду, снег и в дождь.
«Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть «сдвиг данных». Вы можете оценить его масштаб и скорректировать свои действия. Машинно обученные модели должны уметь делать то же самое — оценивать величину сдвига и эффективно действовать в новых условиях. От того, насколько хорошо алгоритм может работать при сдвиге данных, будет зависеть широта его применения», — прокомментировал старший исследователь Yandex Research Андрей Малинин.
Как уточняют в компании, «сдвиг данных» возможен везде, где модели машинного обучения сталкиваются с неопределенностью — незнакомыми ситуациями и неизвестными данными.
Для Shifts Challenge «Яндекс» выбрал три области: предсказание траектории движения транспорта и пешеходов на дороге, прогнозирование погоды, а также машинный перевод текстов.
Участники конкурса должны будут создать устойчивые к сдвигу модели. Например, модель, которая обучалась на художественной литературе, но может качественно переводить и твиты, и ролики на YouTube.
Как надеятся в «Яндексе», конкурс даст ученым доступ к данным, позволяющим оценить качество работы моделей машинного обучения в реальной жизни. Для него исследователи «Яндекса» вместе с командами «Яндекс. Погоды», «Яндекс. Переводчик» и беспилотных технологий предоставили данные сервисов, которые решают практические задачи и часто сталкиваются со сдвигом. Специалисты должны будут обучить алгоритмы на предоставленных данных, а потом проверить качество их работы в условиях сдвига. Создатели алгоритмов, которые покажут лучшее качество, получат денежные призы.
Конкурс Shifts Challenge завершится 30 ноября, когда огласят итоги соревнования. Приз за первое место составит $5 000, за второе — $ 3 000, а за третье — $1 000, говорится на сайте мероприятия.
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Фото:fotodrobik/Shutterstock
Анализ данных или наука о данных :. Какой путь подходит вам? | по Практикуму от Яндекса | Практикум Яндекса
Данные — новое масло во многих отношениях. Во-первых, это невероятно ценный ресурс, важнейший элемент современной экономики. Во-вторых, теперь это топливо, которое поддерживает процессы принятия решений и бизнес-планы компаний. Люди, которые могут помочь компаниям использовать его, например аналитики и специалисты по данным, пользуются большим спросом.
Хотя оба аналитика данных (вы также можете видеть, что их называют, например, «специалисты по данным, специализирующиеся на аналитике»), и специалисты по данным создают ценность для компаний, выявляя закономерности в данных, эти роли включают в себя разные сильные стороны и специализации.
Если вы думаете о карьере в области данных, важно, чтобы вы знали, чем они отличаются с точки зрения наборов навыков , обязанностей и зарплат .
Мы обсудим их по очереди, а затем посмотрим, что включает в себя учебный курс Практикума по каждой дисциплине. Это должно помочь вам определить, какой из них вам больше подходит.
Когда дело доходит до высоких навыков аналитиков данных и специалистов по обработке данных, основное различие заключается в глубине технических знаний, которыми они должны обладать.Это в значительной степени объясняет разницу в заработной плате на двух должностях — подробнее об этом ниже.
Технические навыки, необходимые для должностей аналитика данных и ученого, могут частично совпадать. Ниже приведены общие требования:
- Языки программирования, такие как Python и R (для чтения, обработки и изучения данных)
- SQL (для работы с базами данных)
- Вероятность и статистика (для проверки статистических гипотез [DA] и построения ML models [DS])
В общем, аналитики данных выявляют и интерпретируют закономерности в наборах данных, формулируют и проверяют гипотезы и делают выводы, которые помогают работодателям принимать деловые решения.
Таким образом, аналитикам необходимы сильные навыки в области бизнес-аналитики, визуализации (чтобы они могли четко сообщать свои выводы) и информационных панелей (для автоматизации сбора и визуализации данных). Им также необходимо понимать, в какой сфере они работают; аналитик звукозаписывающей компании должен знать, как работает музыкальная индустрия, но это не так для аналитика страховой компании.
В то время как аналитики данных говорят о прошлом и настоящем, специалисты по данным больше смотрят в будущее.Их сильная сторона — создание моделей и создание алгоритмов для прогнозирования. Поскольку машинное обучение — это довольно техническая область, ожидается, что специалисты по обработке данных будут иметь более глубокое понимание математики и информатики, чем аналитики.
Хотя специалисты по обработке данных часто используют библиотеки машинного обучения, такие как PyTorch и LightGBM, для них важно знать математику, лежащую в основе используемых ими инструментов, в частности статистики, вычислений и линейной алгебры, чтобы они могли эффективно использовать эти инструменты.
Люди, занимающиеся аналитикой, часто связаны с бизнес-командами и должны иметь возможность разъяснять свои выводы неспециалистам, а это означает, что коммуникативные навыки имеют решающее значение.
Это не означает, что специалистам по обработке данных вообще не нужны навыки работы с людьми. Поскольку их работа имеет реальную ценность и значение для бизнеса, людям на этих должностях полезно понимать, как работают компании в целом, а также как модели данных и машинного обучения вписываются в процессы конкретной компании.Тем не менее, от специалистов по обработке данных в первую очередь ожидают глубокие технические знания.
В организационном плане специалисты по обработке данных, как правило, немного отстранены от бизнес-команд, образуя отдельную группу, которая при необходимости работает с различными областями компании.
Аналитики несут ответственность за то, чтобы делать выводы на основе данных и сообщать их деловым людям и заинтересованным сторонам, которые могут не иметь технических знаний.
Они действуют как посредники, связывающие техническую и деловую стороны организации и помогающие преобразовывать необработанные данные в бизнес-идеи.Часто их цель — сделать данные доступными для заинтересованных сторон и лиц, принимающих решения (например, путем создания автоматизированных панелей мониторинга, которые отображают и визуализируют последние данные, или путем разработки и настройки систем отчетности).
Специалисты по обработке данных, со своей стороны, помогают организациям автоматизировать процессы принятия решений. Насколько вероятно, что определенный клиент перестанет пользоваться услугой в следующем месяце или нажмет на конкретную рекламу? Отвечая на подобные вопросы, специалисты по данным позволяют компаниям основывать свои стратегии на данных, а не на догадках или интуиции.
Обе дисциплины востребованы. Наука о данных заняла третье место в отчете LinkedIn о новых вакансиях в США в этом году, и ожидается, что в ближайшие несколько лет количество вакансий как для аналитиков данных, так и для специалистов по обработке данных значительно увеличится.
Что касается заработной платы, то между этими двумя специализациями существует большая разница.
Согласно Indeed, средняя базовая зарплата аналитиков данных в США составляет около 75000 долларов в год, что выше среднего дохода домохозяйства.Однако средняя базовая зарплата специалиста по обработке данных в США значительно выше — в настоящее время более 120000 долларов в год. Для старших специалистов по обработке данных это более 150 000 долларов.
Стоит отметить, что, хотя для многих слово «данные» ассоциируется с технологической отраслью, это лишь одно из многих мест, где аналитики и специалисты по обработке данных могут найти работу. Любым компаниям и организациям — банкам, университетам, государственным учреждениям — нужны профессионалы, умеющие работать с данными.
Какой практический курс вам подходит?
Программы «Data Scientist» и «Data Analyst» в Practicum начинаются с бесплатного 20-часового вводного курса, который знакомит вас с некоторыми знаниями Python и дает представление о работе с данными.Если вам понравился этот курс, у вас есть возможность попробовать полную программу.
Поскольку обе программы разработаны, чтобы помочь вам найти работу в отрасли, они подчеркивают использование важных профессиональных инструментов, таких как среда разработки Jupyter.
Обе программы требуют интенсивной практики, и вы закончите учебу с портфелем проектов, которые сможете продемонстрировать потенциальным работодателям.
Какой бы курс вы ни выбрали, ожидается, что вы будете посвящать ему около 20 часов работы в неделю.
Программа Data Scientist :
- Длится восемь месяцев.
- Включает 16 проектов.
Помимо основных курсов, которыми она делится с Data Analyst, DS включает модули по линейной алгебре, машинному обучению и многому другому.
Программа Data Analyst :
- Длится шесть месяцев.
- Включает 12 проектов.
Включает курсы по бизнес-аналитике, созданию визуализаций и информационных панелей и многое другое.
Учащиеся обеих программ имеют круглосуточный доступ к группе технической поддержки и получают наставничество и поддержку со стороны опытной группы наставников, рецензентов кода и менеджеров сообщества.
Независимо от того, выберете ли вы курс Data Analyst или Data Scientist, вы можете пройти курс подготовки к карьере без дополнительной оплаты. Здесь вы отшлифуете свое резюме, приведете в порядок свое портфолио и пройдете имитационные собеседования. Затем, после того, как вы закончите программу, Practicum будет оказывать вам постоянную поддержку в поиске работы.
Надеюсь, теперь у вас есть лучшее представление о том, что отличает эти две похожие по звучанию специализации друг от друга — и какая из них вам больше подходит, как в личном, так и в профессиональном плане.Стать аналитиком или специалистом по обработке данных сложно, но выполнимо, и практический курс может подготовить студента к работе начального уровня в любой профессии.
Узнайте больше о программах Практикума по науке о данных и анализу данных.
Какая программа звучит более привлекательно и почему? Можете ли вы вспомнить какие-либо другие различия между аналитиками данных и специалистами по анализу данных?
Ответьте в комментариях ниже!
Безопасность | Стеклянная дверь
Мы получаем подозрительную активность от вас или кого-то, кто пользуется вашей интернет-сетью.Подождите, пока мы подтвердим, что вы настоящий человек. Ваш контент появится в ближайшее время. Если вы продолжаете видеть это сообщение, напишите нам чтобы сообщить нам, что у вас возникли проблемы.
Nous aider à garder Glassdoor sécurisée
Nous avons reçu des activités suspectes venant de quelqu’un utilisant votre réseau internet. Подвеска Veuillez Patient que nous vérifions que vous êtes une vraie personne. Вотре содержание apparaîtra bientôt. Si vous continuez à voir ce message, veuillez envoyer un электронная почта à pour nous informer du désagrément.
Unterstützen Sie uns beim Schutz von Glassdoor
Wir haben einige verdächtige Aktivitäten von Ihnen oder von jemandem, der in ihrem Интернет-Netzwerk angemeldet ist, festgestellt. Bitte warten Sie, während wir überprüfen, ob Sie ein Mensch und kein Bot sind. Ihr Inhalt wird в Kürze angezeigt. Wenn Sie weiterhin diese Meldung erhalten, informieren Sie uns darüber bitte по электронной почте: .
We hebben verdachte activiteiten waargenomen op Glassdoor van iemand of iemand die uw internet netwerk deelt.Een momentje geduld totdat, мы узнали, что u daadwerkelijk een persoon bent. Uw bijdrage zal spoedig te zien zijn. Als u deze melding blijft zien, электронная почта: om ons te laten weten dat uw проблема zich nog steeds voordoet.
Hemos estado detectando actividad sospechosa tuya o de alguien con quien compare tu red de Internet. Эспера mientras verificamos que eres una persona real. Tu contenido se mostrará en breve. Si Continúas recibiendo este mensaje, envía un correo electrónico a para informarnos de que tienes problemas.
Hemos estado percibiendo actividad sospechosa de ti o de alguien con quien compare tu red de Internet. Эспера mientras verificamos que eres una persona real. Tu contenido se mostrará en breve. Si Continúas recibiendo este mensaje, envía un correo electrónico a para hacernos saber que estás teniendo problemas.
Temos Recebido algumas atividades suspeitas de voiceê ou de alguém que esteja usando a mesma rede. Aguarde enquanto confirmamos que Você é Uma Pessoa de Verdade.Сеу контексто апаресера эм бреве. Caso продолжить Recebendo esta mensagem, envie um email para пункт нет informar sobre o проблема.
Abbiamo notato alcune attività sospette da parte tua o di una persona che condivide la tua rete Internet. Attendi mentre verifichiamo Che sei una persona reale. Il tuo contenuto verrà visualizzato a breve. Secontini visualizzare questo messaggio, invia un’e-mail all’indirizzo per informarci del проблема.
Пожалуйста, включите куки и перезагрузите страницу.
Это автоматический процесс. Ваш браузер в ближайшее время перенаправит вас на запрошенный контент.
Подождите до 5 секунд…
Перенаправление…
Заводское обозначение: CF-102 / 6b141fdd2c6c3a8f.
Какие данные можно получить в Яндекс Директ?
Какие данные можно получить в Яндекс Директ?
По сценарию Теодора Сандстрёма
Обновлено больше недели назад
При подключении Яндекс Директ вы можете выбрать один из трех типов отчетов: Эффективность кампании, Эффективность рекламы и Эффективность критериев .От того, какой тип отчета вы выберете, зависит, какие измерения вы получите. Независимо от того, какой тип отчета или какие параметры вы выберете, вы получите следующие показатели.
Общие поля
Следующие параметры и показатели будут доступны для всех отчетов.
Общие параметры
Название кампании
Тип кампании
Идентификатор кампании
Тип рекламной сети
Общие показатели
- Показы
Конверсии
Сеансы
Стоимость
Доход
Параметры отчета
Параметры эффективности кампании
Формат объявления
Внешняя сеть параметры производительности
Расширения объявления
Формат объявления
Идентификатор группы объявлений
Название группы объявлений
Ad Href
Идентификатор объявления
Текст объявления
9002Заголовок объявления
Заголовок объявления2
Имя внешней сети
Параметры производительности критериев
Идентификатор группы объявлений
Название группы объявлений
Критерий
Критерий
Тип критерия
Дополнительные размеры
Следующие параметры можно выбрать дополнительно для всех отчетов
Возраст
Тип оператора
Устройство
Имя внешней сети
derМестоположение
Тип соответствия
Мобильная платформа
Размещение
Слот
Местоположение таргетинга
ClickHouse — быстрая СУБД OLAP с открытым исходным кодом
sudo apt-get install apt-transport-https ca-сертификаты dirmngr sudo apt-key adv --keyserver hkp: // сервер ключей.ubuntu.com:80 --recv E0C56BD4 echo "deb https://repo.clickhouse.com/deb/stable/ main /" | sudo tee \ /etc/apt/sources.list.d/clickhouse.list sudo apt-get update sudo apt-get install -y кликхаус-сервер кликхаус-клиент запуск службы sudo clickhouse-server кликхаус-клиент
sudo yum установить yum-utils sudo rpm --import https://repo.clickhouse.com/CLICKHOUSE-KEY.GPG sudo yum-config-manager --add-repo https://repo.clickhouse.com/rpm/clickhouse.repo sudo yum установить кликхаус-сервер кликхаус-клиент sudo / etc / init.d / clickhouse-server start кликхаус-клиент
export LATEST_VERSION = $ (curl -s https://repo.clickhouse.com/tgz/stable/ | \ grep -Eo '[0-9] + \. [0-9] + \. [0-9] + \. [0-9] +' | sort -V -r | голова -n 1) curl -O https://repo.clickhouse.com/tgz/stable/clickhouse-common-static-$LATEST_VERSION.tgz curl -O https://repo.clickhouse.com/tgz/stable/clickhouse-common-static-dbg-$LATEST_VERSION.tgz curl -O https://repo.clickhouse.com/tgz/stable/clickhouse-server-$LATEST_VERSION.tgz curl -O https: // репо.clickhouse.com/tgz/stable/clickhouse-client-$LATEST_VERSION.tgz tar -xzvf clickhouse-common-static- $ LATEST_VERSION.tgz sudo clickhouse-common-static- $ LATEST_VERSION / install / doinst.sh tar -xzvf clickhouse-common-static-dbg- $ LATEST_VERSION.tgz sudo clickhouse-common-static-dbg- $ LATEST_VERSION / install / doinst.sh tar -xzvf clickhouse-server- $ LATEST_VERSION.tgz sudo clickhouse-server- $ LATEST_VERSION / install / doinst.sh sudo /etc/init.d/clickhouse-server start tar -xzvf clickhouse-client- $ LATEST_VERSION.тгз sudo clickhouse-client- $ LATEST_VERSION / install / doinst.sh
Сборка# ARM (AArch64) работает на машинах Amazon Graviton, Oracle Cloud, Huawei Cloud ARM. # Поддержка AArch64 подготовлена к производству. wget 'https://builds.clickhouse.com/master/aarch64/clickhouse' chmod a + x ./clickhouse sudo ./clickhouse установить
wget 'https://builds.clickhouse.com/master/macos/clickhouse' chmod a + x ./clickhouse ./clickhouse
wget 'https://builds.clickhouse.com/master/macos-aarch64/clickhouse' chmod a + x./ clickhouse ./clickhouse
wget 'https://builds.clickhouse.com/master/freebsd/clickhouse' chmod a + x ./clickhouse sudo ./clickhouse установить
Yandex N.V. (YNDX) История цен и данных по акциям
NasdaqGS — Цена NasdaqGS в реальном времени. Валюта в долларах США
81,05-0,83 (-1,01%)На момент закрытия: 16:00 EST
80,25 -0,80 (-0,99%)
В нерабочее время: 19:48 ESTДата Открытие High Low Close * Adj Close ** Volume Nov 19, 2021 81.87 83,87 81,00 81,05 81,05 1,208,900 18 ноября 2021 г. 81,31 82,41 80,94 81,77 81,77 1,631,900 16 ноября 2021 г. 81,20 81,35 80.65 81,31 81,31 464,200 15 ноября 2021 г. 83,36 83,42 81,09 81,77 81,77 80,35 82,07 82,07 2,487,900 11 ноября 2021 г. 82,70 84,69 82,70 83,25 83.25 890,400 10 ноября 2021 г. 84,12 84,53 81,96 82,01 82,01 1,077,700 1,077,700 905 905 84,68 905 84,63 1,494,300 95ноя 08, 2021 86,85 87,11 86,16 86,47 86,47 920,600 86,31 83,92 86,07 86,07 1,488,800 ноябрь 2004 г. 82,32 84,03 82,24 84,00 84,00 1,386,000 ноябрь 02, 2021 82,13 83,49 81.86 82.91 82.91 1,070,300 0 82.46ноябрь 01, 2021 83.01 83.54 81.02 82.46 7 81,37 82,84 82,84 1,373,800 28 октября 2021 г. 79,25 83,55 79,07 83,10 83.10 2,858,100 27 октября 2021 г. 77,42 79,96 77,00 78,01 78,01 2,497,600 76,27 984,900 6325 октября 2021 г. 76,36 77,55 76,17 77,05 77,05 1,325,700 77,03 75,44 75,70 75,70 847,400 21 октября 2021 г. 77,53 77,53 76,27 76,34 76,34 983,100 Октябрь 19, 2021 77,59 77,60 76.51 77,10 77,10 1,734,400 18 октября 2021 года 76,13 76,91 75,79 76,79 76,79 76,00 76,19 76,19 1,193,100 14 октября 2021 года 77,96 77,97 76,93 77,16 77.16 1,067,600 13 октября 2021 года 77,55 78,28 76,69 76,99 76,99 1,363,700 9038 77387 9038 7777 9038 7778 77,30 1,271,700 11 октября 2021 года 78,95 80,12 77,76 77,90 77,90 903,500 , 2086530 79,89 78,93 79,63 79,63 782,600 октябрь 07, 2021 79,06 80,26 78,509 76,06 78,63 75,97 78,53 78,53 1,247,500 05 октября 2021 года 76,14 77,97 75.89 77,53 77,53 1,452,800 4 октября, 2021 78,34 78,56 74,94 75,00 903879,22 79,25 79,25 712,300 30 сентября 2021 года 79,04 80,32 78,97 79,69 79.69 1,072,000 29 сентября 2021 г. 80,02 80,08 78,74 78,95 78,95 883,300 7921907 9 8,9 79,45 991,800 91027 сентября 2021 г. 81,50 82,46 80,21 82,04 82,04 2,294,600 780,41 79,36 80,20 80,20 948,200 23 сентября 2021 г. 79,03 79,52 78,53 78,79 78,79 810900 21 сентября 2021 г. 79,55 79,60 78.21 79,00 79,00 991,700 20 сентября, 2021 79,19 80,12 78,56 79,07 79,07 1,210600 91,13 80,09 80,38 80,38 1,524,000 16 сентября 2021 г. 81,99 82,62 80,85 80,98 80.98 1,635,300 15 сентября, 2021 82,05 82,13 80,75 81,49 81,49 1,196,800 81,87 1,120,300 13 сентября 2021 г. 80,65 81,88 79,86 81,73 81,73 1,551,100 81,73 1,551,100 51 80,60 79,32 80,12 80,12 1,453,900 сентябрь 09, 2021 г. 77,60 78,59 77,02 78,28 78,28 1,354,000 сентябрь 07, 2021 79,10 79,17 77.61 77,62 77,62 1,226,900 сентябрь 03, 2021 77,64 78,90 77,41 78,85 78,85 78,85 78,85 77,30 77,45 77,45 1,352,900 сен 01, 2021 76,66 78,90 76,57 77,87 77.87 2,539,300 31 августа 2021 г. 73,88 77,05 73,70 76,90 76,90 3,529,900 9329 9329 9329 9329 72,13 73,13 1,217,800 3627 августа 2021 г. 70,49 72,42 70,12 72,41 72,41 1,705,800 201345
70,53 69,33 70,40 70,40 1,263,100 25 августа 2021 г. 69,01 69,95 68,82 69,89 69,89 1,054,600 23 августа 2021 г. 68,44 69,16 68.29 68,91 68,91 684,100 20 августа 2021 г. 68,19 68,72 67,74 68,11 68,11 9147700,19 67,73 68,25 68,25 773,900 18 августа 2021 г. 69,06 69,34 68,45 68,58 68.58 779,900 17 августа 2021 года 69,50 69,95 68,83 69,07 69,07 903,800 14 6814 69,51 1,438,800 9150 9150 91507013 августа 2021 г. 67,82 68,09 67,30 67,94 67,94 352,600 202168,87 67,53 67,71 67,71 815 600 11 августа 2021 г. 67,23 67,50 66,65 67,36 67,36 780,800 августа 09, 2021 68,06 68,18 67.48 67,48 67,48 466,200 6 августа 2021 г. 68,03 68,17 66,84 67,80 67.80 67,86 68,05 68,05 665400 Авг 04, 2021 67,42 68,90 67,39 68,39 68.39 747,000 3 августа 2021 г. 67,53 67,70 67,14 67,52 67,52 949,900 7 9387 9387 7 9387 9038 7 9387 7 9389 67,53 993,900 30 июля, 2021 67,64 68,56 67,64 67,93 67,93 июл 1,087,200 567,93 1,087,200 , 6 , 69,17 68,29 68,94 68,94 1,220,800 июл 2021 г. 69,80 69,88 67,42 68,21 68,21 2,031,700 26 июля 2021 г. 70,41 70,66 69.60 69,80 69,80 949,600 23 июля, 2021 70,33 70,51 69,42 70,34 7048 70,34- 38
70,34 70,34 - 38 917 917
69,62 69,93 69,93 593200 21 июля 2021 г. 68,74 69,83 68,48 69,80 69.80 538,400 6738720 июля 2021 г. 68,11 68,99 67,56 68,57 68,57 557,400 557,400 387 387 387 68,35 600600 16 июля 2021 г. 70,24 70,26 69,17 69,64 69,64 930 000 91870,64 69,38 69,69 69,69 609,700 14 июля 2021 г. 70,51 71,48 70,22 70,69 70,69 500,700 12 июля 2021 г. 70,71 71,17 70.41 70,88 70,88 501,900 июл 09, 2021 71,32 71,34 69,26 71,34 69,26 8 70,4470,44 ,200138770,44 ,2001969,65 71,74 71,74 1,375,800 июл 07, 2021 71,61 72,70 71,21 71,83 71.83 1,648,600 июл 06, 2021 71,06 71,29 69,85 70,75 70,75 908,200 70382908,200 7038271,49 71,32 651,600 919** Скорректированная цена закрытия с поправкой на дробление и распределение дивидендов и / или прироста капитала.01 июл, 2021 70,99 71,07 69,72 70,41 70,41 658,100 Загрузка дополнительных данных …
Откройте для себя новые инвестиционные идеи, получив доступ к объективным и глубоким исследованиям инвестиций
Российское правительство заставляет Яндекс делиться личными данными
Российский интернет-гигант Яндекс заявил во вторник, что хочет соблюдать закон, но не нарушать конфиденциальность своих пользователей после сообщения СМИ, в котором говорится, что службы безопасности потребовали передать ключи шифрования.
Медиа-портал РБК ранее во вторник сообщил, что Федеральная служба безопасности (ФСБ) России попросила Яндекс передать ключи шифрования для его почтовой службы Яндекс.Почта и службы файлового хостинга Яндекс.Диск.
Это позволит ФСБ, главному правопреемнику КГБ советской эпохи, легко получить доступ к коммуникациям с людьми.
Яндекс еще не выполнил запрос ФСБ, сделанный несколько месяцев назад, поскольку такой шаг может предоставить доступ к паролям пользователей для всей экосистемы Яндекса, говорится в сообщении.
Россия усилила контроль над Интернетом за последние пять лет, требуя от социальных сетей хранить данные российских пользователей на серверах внутри страны, а от поисковых систем — для удаления некоторых результатов поиска.
Заявление«Яндекс» появилось на следующий день после того, как российский регулятор коммуникаций заявил, что теперь он требует, чтобы приложение для знакомств Tinder передавало данные о своих пользователях.
«В законе говорится о предоставлении информации,« необходимой для декодирования сообщений », что не влечет за собой требования о передаче ключей (шифрования), которые необходимы для декодирования всего трафика», — сказал представитель Яндекса в письменном комментарии. .
Представитель сказал, что можно соблюдать закон без нарушения конфиденциальности пользователей.
«Мы считаем важным соблюдать баланс между безопасностью и конфиденциальностью пользователей, а также учитывать принципы равного регулирования для всех участников рынка».
Информационный бюллетень Daily Sabah
Будьте в курсе того, что происходит в Турции, это регион и мир.
ЗАПИШИТЕ МЕНЯ
Вы можете отписаться в любое время. Регистрируясь, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности. Этот сайт защищен reCAPTCHA, и применяются Политика конфиденциальности и Условия использования Google.
Яндекс запускает курс по маркировке данных Coursera с помощью Toloka
Изображение: Чарльз Делувио через Unsplash
Технический гигант Яндекс, зарегистрированный на NASDAQ, который включает в себя более 90 мобильных приложений, сервисов и продуктов, запускает первый в мире онлайн-курс для удовлетворения растущей потребности в маркировке данных по мере ускорения использования искусственного интеллекта (ИИ).
Курс под названием «Практический краудсорсинг для эффективного машинного обучения» доступен бесплатно на платформе Coursera с 15 марта. Курс основан на практическом подходе и будет проводиться профессионалами из швейцарской Толоки, успешного краудсорсингового центра. платформа для маркировки. Толока представит примеры из реальной жизни по маркировке и обработке данных, что позволит студентам освоить концепции краудсорсинга и запустить свои собственные проекты по маркировке данных в течение пятинедельного курса.
Согласно прогнозам исследовательской компании Cognilytica, рынок сторонней маркировки данных к 2023 году превысит 1 миллиард долларов по сравнению со 150 миллионами в 2018 году, поскольку использование ИИ становится все более распространенным явлением. Развитие ИИ по-прежнему опирается на человеческий интеллект, потому что подготовка данных для ИИ и машинного обучения (МО) требует от людей маркировки данных. Большая часть этой подготовки состоит из той или иной формы маркировки данных и обычно включает в себя классификацию текста или изображений или проверку аудиотранскрипции.
«Освоение технологий краудсорсинга может дать отдельным лицам и предприятиям необходимое им конкурентное преимущество, поскольку пандемия ускоряет внедрение цифровых технологий и подпитывает спрос на технические таланты», — сказала Ольга Мегорская, основатель и генеральный директор Толока. «Я горжусь тем, что принимаю участие в этом курсе и делюсь своим опытом в области маркировки данных, чтобы помочь другим лучше понять это. Этот новый курс позволит студентам применить изученную теорию к реальным задачам и проектам машинного обучения. Поступить бесплатно может любой желающий, независимо от места жительства.’’
Краудсорсинг уже используется передовыми технологическими компаниями и центрами НИОКР по всему миру, включая НАСА. Курс по краудсорсингу включен в учебную программу по социальным вычислениям в Стэнфордском университете. Яндекс также ведет курсы по этой теме в Высшей школе экономики и Московском физико-техническом институте, двух ведущих исследовательских университетах России.
Теперь полный курс «Практический краудсорсинг для эффективного машинного обучения» доступен на Coursera всем, у кого есть доступ к Интернету.
Интерес к образовательным технологиям резко возрос в прошлом году, так как пандемия вынудила многие школы, университеты и другие учебные заведения выйти в Интернет в 2020 году. Coursera из Маунтин-Вью, штат Калифорния, извлекла выгоду из роста дистанционного обучения, сообщив о 353% -ном увеличении новых пользователей и рост числа зачисленных на курсы в прошлом году на 444% по сравнению с предыдущим годом.
Coursera утверждает, что более 200 университетов и предприятий используют его платформу онлайн-обучения, которая предлагает гибкие возможности электронного обучения.На данный момент платформа, которая готовится к IPO, собрала более 75 миллионов учеников.
.