Я взял базу телефонов фирм и фрилансеров, напарсенную когда-то давно для одного свадебного портала. Ничего с ней не делал - городские телефоны не чистил, дубли не чистил, косо введенные тоже не чистил. Только привел все телефоны к виду "7xxxxxxxxxx", который жрет Яндекс и засунул в импорт-файл.
Оно потупило какое-то время, я не дождался, потом вернулся типа через день и увидел вот такую картинку.
https://yadi.sk/i/KYqzGJJEzTAG2
Что за нах? Вот цифра в "Найдено" хорошая, понятная и даже оптимистичная. Но почему цифра "охват" в 4 раза больше?
Ок, есть предположение, но лучше написать в суппорт.
Здравствуйте! Решил поэкспериментировать с новым сервисом, загрузил 1к с небольшим телефонов, и теперь не могу понять вот эту картинку:
https://yadi.sk/i/KYqzGJJEzTAG2
Найдено 282 из 1041 - это понятно и очень похоже на правду (в исходном файле было довольно много городских номеров и криво заполненных).
Не понятно, что значит цифра "охват - 1156"? Это в 4 раза больше, чем число найденных, и даже больше кол-ва строк в исходном файле. Если бы разница была меньше, я бы предположил, что это разные дейвайсы одного пользователя, а так совсем не понятно.
Спасибо! )
Суппорт, подумав для порядка пару дней, прислал вот это:
Илья, добрый день!
Благодарим Вас за ожидание!
1. Расскажем о том, что такое "Охват".
Сегменты состоят из анонимных идентификаторов пользователей в мобильных приложениях и браузерах. Общее количество идентификаторов в сегменте называется его охватом.
Сегменты периодически обновляются. В них автоматически добавляются новые идентификаторы и удаляются старые — так, чтобы в сегментах оставались только идентификаторы, которые были активны в последние 30 дней. Идентификатор становится активным, когда пользователь работает в приложении или браузере. Пользователи могут менять браузеры, переустанавливать приложения и приобретать новые устройства, поэтому охват сегментов может изменяться с течением времени.
2. А цифра в "Найдено" - это соответствия между данными в Вашем файле и всеми накопленными Яндексом данными.
Другими словами, у тех 282 пользователей, которых Яндекс смог идентифицировать, могут быть ещё планшеты + компьютеры дома + компьютеры на работе + ещё один смартфон и т.д. Также пользователь может воспользоваться компьютером/планшетом жены/ребенка и т.п. Это и есть охват. Вы предположили верно.
Если у Вас остались вопросы, пожалуйста, дайте нам знать.
Ага, то есть это реально одни юзеры на нескольких девайсах. Четыре девайса в среднем на юзера - это на глаз перебор, но если внимательно почитать много букв по ссылке, которую они прислали, там можно заметить вот что:
В сегмент будут добавлены анонимные идентификаторы найденных пользователей в мобильных приложениях и браузерах (cookies).
А мобильных приложений у Яндекса - как собак нерезанных, Карты отдельно, Навигатор отдельно, Лаунчер, Браузер мобильный, Метро, ну вы поняли. Скорее всего каждое идет за единичку в этом отчете.
Так что "охват" - цифра все-таки понятная, но не особо полезная. Зато больше четверти найденных контактов для такого списка - это имхо очень даже неплохо.
Яндекс требует импорт-файл не меньше 1000 строк, это в общем понятно. Но, как видим, из них может быть ощутимый процент левых / косых данных, и на ~300 реальных контактов он не ругается. Надо на досуге изучить вот что:
1. Какая нижняя планка у этой цифры.
2. Можно ли одинаковые контакты засовывать в разные сегменты.
И если, например, достаточно условно 10 найденных контактов, и при этом пересечение контактов допускается, мы можем действовать вот так:
1. Генерим 990 левых контактов
2. Добавляем 9 своих симок / мейлов
3. Добавляем 1 реальный контакт
4. Преследуем конкретного чувака с конкретным месседжем по всему РСЯ =)
Звучит заманчиво, надо пробовать =)