Урок 2

Данные и промпты: структура ввода и принципы валидации

В этой главе объясняется, как организовать материалы, поступающие в ИИ, с трех точек зрения: источники информации, временные рамки и ограничения промптов. Это позволяет снизить искажение торговых решений, вызванное галлюцинациями и нарративами выживших.

1. Исходная точка: качество результата зависит от структуры ввода

В уроке 1 мы выделили шесть этапов, на которых ИИ встраивается в торговый процесс, и организация информации стоит на первом месте. Если резюме неточны, даты перепутаны, а источники не отслеживаются, то последующая генерация гипотез, обсуждение бэктестов и контрольные списки рисков лишь усиливают изначальные ошибки. Именно поэтому урок 2 делает акцент не на методах «постановки лучших вопросов», а на структурной дисциплине на этапе ввода: результаты модели по умолчанию должны восприниматься как требующие проверки, а не как установленные факты.

В контексте трейдинга галлюцинации обычно означают не то, что модель намеренно фабрикует данные, а то, что она генерирует плавный и уверенный текст, который невозможно сопоставить с проверяемыми первичными источниками. Типичные варианты: вымышленные анонсы или ссылки, путаница между рыночной капитализацией и циркулирующим предложением, применение устаревших данных к текущим вопросам, использование формулировок вроде «данные сети показывают» без указания адресов, временных окон или статистических стандартов. Решение — не отвергать ИИ, а для каждого фрагмента информации, поступающего в процесс принятия решений, указывать уровень источника, временные границы и шаги проверки.

2. Градация источников: построение работающей системы классификации

Перед передачей материалов ИИ стоит оценить источники и потребовать от модели маркировать каждый ключевой пункт в промпте по уровню источника. Цель градации — не формальность, а четкое разделение: какой контент можно считать фактом, а какой — лишь предположением или непроверенным суждением.

  • Первичные источники — официальные сайты проектов, записи релизов на GitHub, объявления бирж и регуляторов, обозреватели блокчейнов и экспортируемые данные транзакций. Эти материалы относительно надежны, но все равно требуют бдительности: ссылки и домены следует проверять вручную на предмет фишинга и подделок.

  • Вторичные источники — отчеты исследовательских институтов, аудиторские документы и страницы с резервами. Они помогают понять механизмы, но необходимо проверять, покрывают ли дата публикации и объем аудита текущую структуру.

  • Мейнстримные СМИ — интерпретации политики можно использовать для справки, но ключевые выводы нужно перекрестно сверять с первичными документами.

  • Социальные сети, KOL и контент сообществ — подходят только как отправная точка для поиска проблем и не могут самостоятельно обосновывать сделку. Анонимные скриншоты и «инсайдерская информация» по умолчанию исключаются из торговой логики.

Требования к промпту: для фактических утверждений разрешены только источники высокого уровня; источники среднего и низкого уровня должны маркироваться как «сообщается» или «непроверено»; пункты без источника или даты единообразно помечаются для проверки. Даже если модель по-прежнему ошибается, такой формат вывода упрощает ручную фильтрацию.

3. Временные метки и стандарты: криптоданные склонны к «старым данным в новом контексте»

Обучение модели и поиск отстают от реальных событий, а механизмы проектов часто обновляются. При запросах указывайте временные диапазоны — например, анализируйте только материалы после определенной даты; потенциально устаревшую информацию помечайте как «по состоянию на [дата]». При сравнении цен или метрик уточняйте интервал свечи, биржу, торговую пару, спотовый или бессрочный рынок и т.д. Для сетевых статистик указывайте название сети, адрес контракта, статистическое окно и то, включены ли притоки и оттоки бирж. Один и тот же вопрос при разных стандартах может дать противоположные выводы — стандарт должен быть фиксированным полем промпта, а не примечанием после факта.

4. Нарративы выживших и противоречивые свидетельства

В обсуждениях криптовалют часто показывают только прибыльные случаи, используют лишь выборки бычьего рынка или цитируют бэктесты из периодов роста. Нарративы ИИ склонны делать истории законченными, игнорируя неудачные примеры конкурентов. Контрмеры: требовать как подтверждающих, так и опровергающих свидетельств; указывать размер выборки и временной промежуток; отвечать «невозможно определить», когда данных недостаточно, а не выдавать принудительный вывод. Исследовательский диалог лучше подходит для представления сценариев и условий неудачи, чем для прямых рекомендаций лонг или шорт.

5. Структура промпта: ограничение формы, а не риторические излишества

Эффективные промпты обычно состоят из четырех частей:

  • Заявление о сфере — роль исследовательского ассистента, без рекомендаций по токенам, без гарантированной доходности

  • Условия ограничений — никаких сфабрикованных ссылок, маркировка неопределенностей, правила градации источников

  • Формат вывода — аргумент, основание, уровень источника, дата, условия недействительности

  • Шаги проверки — требуются ручные проверки: открыть URL анонса или верифицировать хеши транзакций в сети

В конце каждого диалога формируйте контрольный список проверки, который нужно выполнить вручную перед переходом к гипотезам или торговым шагам. Длина промпта не имеет значения; главное, чтобы источник, временные рамки и стандарты были зафиксированы.

6. Разделение труда по данным: цифры предоставляет человек, модель занимается интерпретацией

Более надежное разделение труда: рыночные и сетевые данные экспортируются из API, бирж или обозревателей и передаются ИИ в виде сырых таблиц или с четкими полями. Модель интерпретирует значения, выявляет несоответствия и помогает структурировать гипотезы, но не генерирует критические значения самостоятельно. Если модель участвует в расчетах, требуйте отображения формул и промежуточных шагов, а ключевые выводы пересчитывайте вручную. Длинные диалоги рискуют смещением контекста: важные темы лучше начинать в новых ветках, проверенные факты архивировать отдельно и ссылаться на них только при необходимости, чтобы избежать засорения контекста.

7. Резюме урока

Этот урок посвящен этапу, предшествующему использованию ИИ: откуда берутся материалы, содержат ли они даты и стандарты, можно ли использовать источники низкого уровня для обоснования торговых решений. Галлюцинации и нарративы выживших — это обычно не «бессмысленная речь» модели, а результат непроверенных утверждений, устаревших данных или выборочных историй успеха на входе. Встраивая градацию источников, временные границы и контрольные списки проверки в фиксированный процесс, мы добиваемся того, что результаты по умолчанию становятся черновиками, требующими верификации перед обсуждением гипотез или позиций. Следующий урок будет посвящен валидации стратегии: после очистки входных данных необходимо отдельно проверять данные, затраты и результаты вне выборки — одних кривых бэктестов недостаточно для обоснования стратегии.

Отказ от ответственности
* Криптоинвестирование сопряжено со значительными рисками. Будьте осторожны. Курс не является инвестиционным советом.
* Курс создан автором, который присоединился к Gate Learn. Мнение автора может не совпадать с мнением Gate Learn.