Структура датасета и готовый код для fine-tuning Qwen2.5 под задачу анализа таблиц маршрутизации. Основной подход — синтетическая генерация данных и обучение с Chain-of-Thought (CoT), что доказало свою эффективность для сетевых задач Структура обучающего датасета Формат данных должен имитировать реальный диалог с моделью, где на вход подается таблица и вопрос, а на выходе — рассуждение (CoT) и ответ. JSON { "messages": [ { "role": "system", "content": "You are a network routing expert. Analyze the routing table, detect issues, and provide step-by-step reasoning." }, { "role": "user", "content": "Routing table:\n\n\nQuestion: Does this routing table contain a routing loop or summarization error?" }, { "role": "assistant", "content": "\n1. I will examine the routing table for duplicate routes with equal metrics.\n2. I will check for overlapping networks that indicate poor summarization.\n3. [Step-by-step analysis of the specific table]\n\n\nYes, a potential routing loop exists between ...\n" } ] } Рекомендации по созданию данных: Синтетическая генерация: Используйте LLM (DeepSeek-R1, Qwen 2.5 72B) для генерации разнообразных примеров таблиц маршрутизации с различными ошибками . Генерация должна быть целевой: вы создаете запросы, в которых указываете, какие ошибки должна содержать таблица (петли, неверная суммаризация). Структуризация: Используйте инструменты вроде promptwright для масштабной генерации на основе графа тем . Баланс: Обеспечьте разнообразие примеров: "здоровые" таблицы, таблицы с петлями, ошибками суммаризации, проблемами next-hop и т.д. https://ai-fine-tuning.blogspot.com/ http://webcode.shmeleff.com/page0005.htm