Задание
У вас есть четыре документа:
a fat cat sat on a mat and ate a fat rat,
little funny fluffy cat,
the cat,
huge green crocodile.
И есть стоп-слова: “a”, “the”, “on”, “cat”. Приходит запрос: funny fat cat. Найдите все документы, где есть хотя бы одно слово из запроса. Учтите стоп-слова и не включайте их в результаты поиска. Примерный алгоритм:
Берёте слово из запроса, проверяя, что это не стоп-слово;
Ищете слово в контейнере;
Спрашиваете у контейнера, в каких документах это слово встречается. У контейнера уже есть ответ;
Добавляете индексы документов к результату;
Повторяете все шаги для каждого из слов в запросе;
Помещаете все результаты в вектор и отправляете пользователю.
Упомянутый в алгоритме контейнер — это map. Ключом в map будет слово, а значением — некий контейнер документов, в которых это слово встречается. Важно правильно записывать в словарь элементы в момент добавления документа.
Запрос funny fat cat должен сработать так:
Берёте слово “funny”, которое не входит в список стоп-слов;
Обращаетесь к словарю и находите в нём “funny”;
В словаре по ключу “funny” уже должен быть записан документ 1;
Добавляете документ 1 в результирующий вектор;
Берёте слово “fat”. Оно тоже не входит в список стоп-слов;
В словаре по ключу “fat” лежит документ 0;
Добавляете документ к результату;
“Cat” — стоп-слово, поэтому оно вам не интересно;
Возвращаете пользователю вектор с двумя элементами: 0 и 1.
Напишите функции AddDocument и FindDocuments, которые бы реализовывали решение описанной задачи. AddDocument должна заполнять индекс word_to_documents:
void AddDocument(map >& word_to_documents,
const set & stop_words,
int document_id,
const string& document);
Функция FindDocuments должна искать и выдавать требуемые идентификаторы документов в виде вектора:
vector FindDocuments(const map >& word_to_documents,
const set & stop_words,
const string& query);
В векторе с результатами не должно быть повторов. Используйте для избегания дубликатов контейнер set как промежуточный. При копировании из set в вектор результатов не меняйте порядок элементов.
Не меняйте сигнатуру FindDocuments.
СТРОКА СТОП-СЛОВ ЧИСЛО ДОКУМЕНТОВ ДОКУМЕНТ0 ДОКУМЕНТ1 ДОКУМЕНТ2 ДОКУМЕНТ3 ЗАПРОС
a the on cat 4 a fat cat sat on a mat and ate a fat rat little funny fluffy cat the cat huge green crocodile funny fat cat
Вывод (id документов):
0
1
184
469
Ответы на вопрос:
Реши свою проблему, спроси otvet5GPT
-
Быстро
Мгновенный ответ на твой вопрос -
Точно
Бот обладает знаниями во всех сферах -
Бесплатно
Задай вопрос и получи ответ бесплатно
Популярно: Информатика
-
zadrotovg17.05.2023 07:15
-
Настя1676463117.01.2020 22:34
-
oksanavolkova322.11.2021 19:07
-
8900056600418.05.2021 09:17
-
КамбэкBTS16.06.2020 14:55
-
CandyBitch66604.11.2021 11:34
-
ulialepsha30.05.2022 13:49
-
chitaevtimur13417.08.2021 14:56
-
Оля01072024.10.2022 19:48
-
RomashechkaRomova12.08.2022 06:19
Есть вопросы?
-
Как otvet5GPT работает?
otvet5GPT использует большую языковую модель вместе с базой данных GPT для обеспечения высококачественных образовательных результатов. otvet5GPT действует как доступный академический ресурс вне класса. -
Сколько это стоит?
Проект находиться на стадии тестирования и все услуги бесплатны. -
Могу ли я использовать otvet5GPT в школе?
Конечно! Нейросеть может помочь вам делать конспекты лекций, придумывать идеи в классе и многое другое! -
В чем отличия от ChatGPT?
otvet5GPT черпает академические источники из собственной базы данных и предназначен специально для студентов. otvet5GPT также адаптируется к вашему стилю письма, предоставляя ряд образовательных инструментов, предназначенных для улучшения обучения.