Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Задание состоит из нескольких частей:

Обучить модель машинного обучения на Python для решения задачи классификации новостных русскоязычных текстов по темам: экономика, политика, социальная сфера, здравоохранение, образование, экология, либо отнесение к категории "не заданная категория". Для классификации должен использоваться метод наивного байеса. Обучающую выборку я предоставлю.

Обучить модель машинного обучения на Python для решения задачи классификации русскоязычных комментариев по тональности: позитивная, негативная, нейтральная. Метод, используемый для классификации не принципиален, но необходимо указать его в комментариях к коду.

Обе модели должны сохранять текущее состояние, т.е. не обучаться с нуля при каждом запуске скрипта, а использовать уже имеющиеся знания для классификации.

Необходимо парсить посты и комментарии к ним из групп, начиная с 01.01.2024. Сообщества:

https://vk.com/mos

https://vk.com/m24

При запуске скрипта должны происходить следующие действия:

1)Создание .csv файла, который должен содержать в себе поля:

Post_ID – уникальный идентификатор каждой записи в таблице; Post_text – текстовое содержание поста;

Group – название группы, из которой был взят пост;

Post_date – дата публикации поста в формате дд.мм.гггг;

Post_topic – тема публикации – поле заполняется путем применения обученной ранее модели;

ERpost – коэффициент вовлеченности в обсуждение поста, который рассчитывается по формуле:

ERpost = (количество реакций на публикации + количество комментариев на публикации + количество репостов на публикации)/количество просмотров публикации.

Comment_text – текстовое содержание комментария к конкретной публикации;

Comment_tonality – поле, содержащее в себе оценку тональности комментария – поле заполняется путем применения обученной ранее модели;

Age – возраст автора комментария;

Gender – пол автора комментария.

Необходимо предоставить исходные файлы с кодом, весь код должен быть написан в объектно-ориентированном стиле и разбит на файлы для лучшей читаемости, должны быть соблюдены ограничения по количеству запросов к API вконтакте. При каждом запуске скрипта парсинг должен начинаться с последнего записанного в файле поста (т.е. последний пост пропускается и в файл записывается следующий за ним пост), в случае удаления со стены группы последнего поста - парсить начиная с последнего неудаленного поста. В случае, если какая-либо информация в профиле автора комментария недоступна/неуказана - оставить поле пустым.

17 дней назад
Александр
17 дней в сервисе
Был
17 дней назад
Заявки фрилансеров
Юрий
21 год
год в сервисе
Был
4 дня назад
8 дней назад
Маркиян
25 лет
год в сервисе
Был
3 часа назад
3 отзыва
17 дней назад
ТОП-10
Прикладное ПО
Дмитрий
21 год
2 года в сервисе
Был
час назад
3 отзыва(-2)
17 дней назад
  • Похожие заказы
  • Нужен скрипт для отправки данных из гугл таблиц в канал ТГ вид сообщения однотипный: параметр 1 - данные из ячейки А2 (сделать ссылкой) параметр 2 - данные из ячейки S2 ...

    Закрыт
    17 дней назад
  • Нужно создать программу численного интегрирования системы обыкновенных дифференциальных уравнений, описывающих управляемое движение космического аппарата. Создать нужно на Delphi. Для реализации требуется использовать библиотеку моделирования сложных динамических систем Simulate+, а также типы данных и классы, ...

    Закрыт
    15 дней назад
  • Всем доброго времени суток! Для дипломной работы на тему "Разработка и исследование методов создания и использования систем управления изменениями в информационных технологиях" необходимо разработать метод создания и использования систем управления изменениями в информационных технологиях, если ...

    Закрытнет даты
  • Нужно написать программу на Pytnon с использованием библиотек opencv, которая будет на видеопотоке с камеры определять дефект на плате+ нужен интерфейс на который будет выводиться информация

    Открыт
    22 дня назад
  • есть две задачи: 1. скрипт для заполнения полей пдф данными из таблицы 2. формирование письма-рассылки с несколькими предложениями с кнопкой "выбрать" каждое предложение. данные предложений генерировать из двух гугл-таблиц: с ...

    Открыт
    22 дня назад
  • $30

    Настроить амо срм для работы небольшого автосервиса. Желательно чтобы у Вас был опыт такой настройки и можно было посмотреть какие моменты учтены в карточках и удобно ли будет работать.

    Прикладное ПОнет заявок
    Открыт
    24 дня назад
  • Нужно спарсить данные сайта https://pc-builds.com/ru/fps-calculator/ по всем возможным свойствам. При заполнении свойств и перехода на страницу информации (путем клика на кнопку "приступить к расчёту") открываются данные которые нужно спарсить https://photo-screen.ru/i/9kR9RApFG (показал на картинке)

    Прикладное ПО1 исполнитель
    Завершен
    24 дня назад