Skip to content

l-m-n-d-k/Feedback-Sorting-System

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 

Repository files navigation

Feedback Sorting System

Система анализа тональности отзывов с Wildberries на основе scikit-learn.
Классифицирует отзывы как позитивные или негативные с указанием уверенности модели.

Стек

  • Python 3.10+
  • scikit-learn — обучение модели (TF-IDF + Logistic Regression)
  • HuggingFace Datasets — загрузка датасетов
  • joblib — сохранение и загрузка модели

Датасеты

Назначение Ссылка
Обучение nyuuzyou/wb-feedbacks
Тестирование Roaoch/urfu_ecom_wb

Структура проекта

src/
├── main.py       — точка входа
├── train.py      — загрузка данных и обучение модели
├── predict.py    — загрузка модели и предсказания
├── cli.py        — интерактивный интерфейс в терминале
└── config.py     — константы (пути, параметры датасета)

Установка

git clone <repo-url>
cd Feedback-Sorting-System

pip install scikit-learn datasets joblib

Запуск

cd src
python main.py

При первом запуске система автоматически загрузит датасет и обучит модель.
При повторных запусках предложит использовать сохранённую модель или переобучить.

Как это работает

отзыв → TfidfVectorizer → LogisticRegression → позитивный / негативный

Обучающий датасет содержит отзывы с оценками 1–5. Оценки конвертируются в метки:

  • 4–5positive
  • 1–2negative
  • 3 → пропускается (неоднозначно)

Модель обучается на 100 000 примерах с разбивкой 80/20 на train/test.

Пример работы

Введите отзыв (или 'выход' для завершения):

Отзыв: Отличный товар, очень доволен покупкой!
  → Позитивный (уверенность: 94.3%)

Отзыв: Пришёл бракованный, требую возврата
  → Негативный (уверенность: 88.7%)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages