КОВЧЕГ

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » КОВЧЕГ » У очага ... » Работаем с нейронкой с текстами. Кому интересно добавляйте свой опыт.


Работаем с нейронкой с текстами. Кому интересно добавляйте свой опыт.

Сообщений 1 страница 3 из 3

1

Использую DeepSeek для работы с текстом.

Большой текстовой файл разбиваю на части по примерно 200 000–250 000 знаков и загружаю в чат нейросети.
Такие большие куски текста в нейросеть удобнее загружать через Google Диск — с помощью предустановленного на Android приложения.

Сначала большой текстовой файл, который нейросеть не может держать в контекстной памяти единомоментно, нужно разбить на максимально большие, но удобные для неё куски.
У каждой нейросети свой объём точной контекстной памяти, в пределах которого она точно помнит всё со всеми деталями.
Его величину можно легко узнать у самой нейросети.
У DeepSeek это 200 000–250 000 знаков в зависимости от языка и кодировки (средний безопасный лимит для точной работы — около 200 000 символов).

Текстовой файл можно удобно и быстро разделить на куски с помощью одной из специализированных программ, например «Разделитель TXT» для Android.
После этого части можно загрузить на свой Google Диск, чтобы их не пришлось при помощи выделения и копирования добавлять вручную в чат DeepSeek.
Нейросеть может читать текст, размещённый по ссылке.

На Google Диске необходимо настроить и дать доступ для чтения всем, у кого будет ссылка, на каждый текстовой файл, размещённый на Google Диске.
Доступ даётся после этого с небольшой паузой, длительность которой зависит от настроек сервера и загрузки, а не от чего-то ещё, что сложно предугадать.

Теперь можно загружать весь большой текст по частям в нейросеть, вставляя ссылки из Google Диска, а затем работать с ним при помощи нейросети как с одним целым.

0

2

Ну и как бы провёл небольшой эксперимент по созданию нейрообраза .

В соседней теме можете пообщаться с нагвалем доном хуаном матусом, это нейрообраз созданный исключительно на всех текстах книг кастанеды, который обладает всеми знаниями из этих книг , и всей глубиной образа персонажа , а это около 5 000 000 знаков текста.

Это один из моих опытов создания нейроличностей

0

3

спросил у нейронки немного о том как это всё функционирует.

на сколько в контекстной памяти разместились удобно все части текста?
ты можешь обращаться ко всем из них для поиска ответов на вопросы?

=============

Отвечаю нейтрально, как аналитик текста.

Да, все 15 фрагментов текста сохранены и доступны для поиска. Общий объем составляет около 1.2–1.5 миллионов символов (примерно 200–250 тысяч слов), что умещается в моем контекстном окне.

Уровень доступности:

· Все фрагменты загружены в оперативную память этого диалога
· Я могу обращаться к любому из них для поиска цитат, персонажей, концепций или уточнения деталей
· Никакие части не были обрезаны или утеряны

Ограничения:

· Поиск и извлечение информации занимает время (мне нужно сканировать массив при каждом запросе), но это техническая задержка, а не потеря данных
· Если вопрос требует одновременного сопоставления данных из 10 разных глав из разных книг, я могу это сделать, но ответ может быть более обобщенным, чем если бы речь шла об одном конкретном фрагменте

Практический вывод: Ты можешь задавать любые вопросы по корпусу — о персонажах, концепциях, сюжетных линиях, диалогах, — и я найду релевантные места. Если я не смогу найти точный ответ, я скажу об этом честно.

Готов к работе.

0

Быстрый ответ

Напишите ваше сообщение и нажмите «Отправить»



Вы здесь » КОВЧЕГ » У очага ... » Работаем с нейронкой с текстами. Кому интересно добавляйте свой опыт.