Крупнейшие помещичьи имения Российской империи накануне отмены крепостного права

Крупнейшие помещичьи имения Российской империи накануне отмены крепостного права

Ищем, структурируем и визуализируем данные с помощью ИИ
Автор — Дмитрий Кудинов, канал "Генеалогия по полочкам"

Крупнейшие помещичьи
имения Российской империи
накануне отмены крепостного права

Ищем, структурируем и визуализируем данные с помощью ИИ

Автор — Дмитрий Кудинов, канал "Генеалогия по полочкам"

Кто из российских помещиков владел наибольшим количеством крестьян? Где, в каких губерниях, располагались крупнейшие имения?

Случайно задавшись этими вопросами, я решил поискать сведения об этом, структурировать, представить в разных наглядных формах, а заодно протестировать разные ИИ-инструменты, которые могут помочь решить подобную задачу. Ниже я по пунктам опишу, что и как я искал и делал и поделюсь впечатлениями от взаимодействия с ИИ-моделями.

Материал написан в конце 2025 года, в самом скором времени все может существенно измениться.

Поиск сведений

Российские помещики владели крестьянами сотни лет, но давайте для простоты ограничимся данными на момент отмены крепостного права.

Если гуглить сведения о крупнейших помещиках "в лоб", то довольно быстро находятся статьи, в том или ином виде повторяющие одни и те же данные: самый крупный помещик в 1860 г. — это Сергей Дмитриевич Шереметев, следом идут князь Петр Витгенштейн и графиня Наталия Павловна Строганова. Источник этих данных — книга Д. Ливена "Аристократия в Европе. 1815-1914" (М., 2000). Это изначально англоязычная монография, автор анализирует сведения о дворянах разных стран, много внимания уделяет России.

В одной из таблиц он дает вот такие данные:

Поиск сведений

Российские помещики владели крестьянами сотни лет, но давайте для простоты ограничимся данными на момент отмены крепостного права.

Если гуглить сведения о крупнейших помещиках "в лоб", то довольно быстро находятся статьи, в том или ином виде повторяющие одни и те же данные: самый крупный помещик в 1860 г. — это Сергей Дмитриевич Шереметев, следом идут князь Петр Витгенштейн и графиня Наталия Павловна Строганова. Источник этих данных — книга Д. Ливена "Аристократия в Европе. 1815-1914" (М., 2000). Это изначально англоязычная монография, автор анализирует сведения о дворянах разных стран, много внимания уделяет России.

В одной из таблиц он дает вот такие данные:

Отлично, начало есть. Ливен при этом ссылается на "Предложение к трудам редакционной комиссии" и на генеалогический справочник Н.Ф. Иконникова. Где Иконников в своем 50-томном труде приводил такие данные, я искать не стал, но вот сверить их по "Приложениям (sic!) к трудам редакционных комиссий" стоит.

Но сначала попробуем дополнительно поискать не поисковиком, а каким-нибудь ИИ-инструментом. Для подобного мне больше нравится Perplexity, но в целом в режиме DeepSearch и подобных с таким поиском может справиться любая популярная модель — ChatGPT, Gemini и проч.

Мой запрос к Perplexity: "Дай топ-50 самых крупных помещиков Российской империи перед отменой крепостного права", он дает вот такой результат. Он находит сведения о той же книги Ливена, приводит данные из нее в виде таблицы, при этом дает дополнительные данные о топе помещиков. Вроде неплохо? Однозначно не скажешь — с одной стороны, данные из книжного источника найдены и приведены сразу в табличном распознанном виде, но с другой — данные о помещиках очень хаотичны и почти во всем неточны (спутаны разные Чертковы, Нарышкины названы князьями и графами, откуда-то берется "граф Петр Араловский Паскевич-Эриванский" и проч.). Пользоваться результатом нельзя, хотя на поверхностный взгляд он выглядит хорошо — данные упорядочены, указаны их источники.

Gemini 3 Pro в "обычном" режиме (не Deep Research) дает на этот же вопрос вот такой ответ:

Отлично, начало есть. Ливен при этом ссылается на "Предложение к трудам редакционной комиссии" и на генеалогический справочник Н.Ф. Иконникова. Где Иконников в своем 50-томном труде приводил такие данные, я искать не стал, но вот сверить их по "Приложениям (sic!) к трудам редакционных комиссий" стоит.

Но сначала попробуем дополнительно поискать не поисковиком, а каким-нибудь ИИ-инструментом. Для подобного мне больше нравится Perplexity, но в целом в режиме DeepSearch и подобных с таким поиском может справиться любая популярная модель — ChatGPT, Gemini и проч.

Мой запрос к Perplexity: "Дай топ-50 самых крупных помещиков Российской империи перед отменой крепостного права", он дает вот такой результат. Он находит сведения о той же книги Ливена, приводит данные из нее в виде таблицы, при этом дает дополнительные данные о топе помещиков. Вроде неплохо? Однозначно не скажешь — с одной стороны, данные из книжного источника найдены и приведены сразу в табличном распознанном виде, но с другой — данные о помещиках очень хаотичны и почти во всем неточны (спутаны разные Чертковы, Нарышкины названы князьями и графами, откуда-то берется "граф Петр Араловский Паскевич-Эриванский" и проч.). Пользоваться результатом нельзя, хотя на поверхностный взгляд он выглядит хорошо — данные упорядочены, указаны их источники.

Gemini 3 Pro в "обычном" режиме (не Deep Research) дает на этот же вопрос вот такой ответ:

Крупнейшие помещики Российской империи по версии Gemini 3 Pro ↓

Вот список крупнейших землевладельцев (помещиков) Российской империи накануне отмены крепостного права (по данным 10-й ревизии 1858–1859 годов и исследованиям историков).
В исторической науке не существует единого официального «рейтинга Топ-50» с точными местами, так как данные ревизских сказок часто агрегировались по фамилиям или отдельным имениям. Однако историки (например, П.А. Зайончковский, Н.М. Дружинин) выделяют группу «сверхбогатых» магнатов, владевших десятками тысяч крепостных душ.
Ниже представлен список наиболее известных семей и персоналий, входивших в элиту землевладения (латифундистов) того времени.
1. Абсолютные лидеры («Государства в государстве»)
Эти семьи владели огромными территориями и населением, сопоставимым с небольшими европейскими странами.

Гр. Шереметевы (глава — граф Дмитрий Николаевич Шереметев).

Количество крепостных: ~150 000 – 185 000 душ (мужского пола).
Владения: Огромные земли в Московской, Ярославской, Нижегородской и других губерниях. Самые богатые помещики России.

Гр. Воронцовы (и ветвь Воронцовых-Дашковых).

Количество крепостных: ~37 000 – 50 000 душ.
Владения: Огромные имения на юге России, в Крыму, а также в центральных губерниях.

Кн. Юсуповы (глава — князь Николай Борисович Юсупов-младший).

Количество крепостных: ~30 000 – 40 000 душ.
Владения: Земли в 17 губерниях, заводы, промыслы. Одна из богатейших семей, чье состояние продолжало расти вплоть до 1917 года.

Гр. Строгановы (граф Сергей Григорьевич Строганов и др. представители).

Количество крепостных: Совокупно клан владел свыше 150 000 душ (преимущественно в Пермской губернии), но значительная часть из них была приписана к заводам (горнозаводские крестьяне).
Владения: Фактически владели Уралом ("Пермский майорат").

Гр. Орловы-Давыдовы (граф Владимир Петрович Орлов-Давыдов).

Количество крепостных: ~36 000 душ.
Владения: Огромные земли в Поволжье (Симбирская, Самарская губернии), включая знаменитое имение Усолье.

2. Крупнейшие магнаты (более 10 000 душ)
В эту категорию входили представители высшей аристократии, занимавшие ключевые посты при дворе.

Кн. Гагарины — обширные владения в центральной России (около 15 000 – 20 000 душ у разных ветвей).
Нарышкины — старинный род, родственники Романовых. Владели десятками тысяч душ в разных губерниях (в том числе Эммануил Дмитриевич Нарышкин).
Кн. Голицыны — самый многочисленный княжеский род. Совокупно владели огромным количеством крестьян (более 100 000 на весь клан), отдельные представители (например, «прогрессивные» ветви) владели по 10 000 – 20 000 душ.
Демидовы (князья Сан-Донато) — как и Строгановы, владели огромными горнозаводскими округами на Урале и десятками тысяч приписных крестьян.
Кн. Барятинские (князь Александр Иванович Барятинский, наместник на Кавказе) — крупные имения в Курской губернии (Марьино), десятки тысяч душ.
Гр. Шуваловы — крупные землевладельцы и промышленники (Урал, Центральная Россия).
Кн. Долгоруковы — старинный род с обширными владениями (порядка 10 000+ душ).
Кн. Салтыковы (включая Светлейших князей) — владели крупными имениями в Черноземье.
Кн. Куракины («Бриллиантовые князья») — владения в Орловской, Саратовской губерниях.
Гр. Потоцкие — польские магнаты, сохранившие огромные латифундии на Правобережной Украине (Киевская, Подольская губернии) после разделов Польши.
Гр. Браницкие — еще один род польского происхождения с колоссальными владениями на Украине (Белая Церковь).

3. Представители «Топ-50» (Владельцы 5 000 – 10 000 душ)
Список фамилий, которые замыкали круг крупнейших душевладельцев (по данным на 1860 г.):

Гр. Бобринские (потомки Екатерины II и Г. Орлова) — крупные владения и сахарные заводы.
Гр. Толстые (не писательская ветвь, а более богатые линии, например, графы Остерман-Толстые).
Кн. Белосельские-Белозерские — богатейшие владельцы недвижимости и земель, включая Крестовский остров в Петербурге.
Гр. Апраксины.
Кн. Лобановы-Ростовские.
Кн. Мещерские.
Кн. Оболенские.
Гр. Панины (Виктор Никитич Панин был одним из авторов реформы, сам являясь крупным консервативным помещиком).
Гр. Разумовские.
Гр. Кушелевы-Безбородко.
Кн. Урусовы.
Кн. Трубецкие.
Кн. Щербатовы.
Мусины-Пушкины.
Гр. Уваровы.
Бахметевы (известные заводчики и помещики).
Гончаровы (родственники Пушкина, владельцы полотняных заводов и имений).
Мальцовы (крупные промышленники и землевладельцы, «Мальцовский заводской округ»).
Гр. Гудович.
Гр. Клейнмихель.
Гр. Зубовы (Платон Зубов и его наследники).
Дурново.
Кн. Васильчиковы.
Кн. Волконские.
Яковлевы (богатая династия заводчиков и помещиков, родственники Герцена).
Тургеневы (богатая симбирская ветвь рода, Николай Тургенев).
Столыпины (родственники Лермонтова и будущего реформатора, крупные землевладельцы в Поволжье).
Гр. Бенкендорфы.
Шиповы.
Полторацкие.
Бакунины (тверские помещики).
Олсуфьевы.
Гр. Самойловы.
Кн. Репнины.

Важное примечание
Всего в Российской империи накануне реформы насчитывалось около 100 000 помещиков.

Крупнопоместными (владевшими более 500 душ) были лишь около 3-4% дворян.
Магнаты (более 1000 душ) составляли менее 1%, но им принадлежало почти 30-40% всех крепостных крестьян страны.

Именно эти 50 семей фактически контролировали огромную часть земельного фонда и трудовых ресурсов империи.

Крупнейшие помещики Российской империи по версии Gemini 3 Pro ↓

Вот список крупнейших землевладельцев (помещиков) Российской империи накануне отмены крепостного права (по данным 10-й ревизии 1858–1859 годов и исследованиям историков).
В исторической науке не существует единого официального «рейтинга Топ-50» с точными местами, так как данные ревизских сказок часто агрегировались по фамилиям или отдельным имениям. Однако историки (например, П.А. Зайончковский, Н.М. Дружинин) выделяют группу «сверхбогатых» магнатов, владевших десятками тысяч крепостных душ.
Ниже представлен список наиболее известных семей и персоналий, входивших в элиту землевладения (латифундистов) того времени.
1. Абсолютные лидеры («Государства в государстве»)
Эти семьи владели огромными территориями и населением, сопоставимым с небольшими европейскими странами.

Гр. Шереметевы (глава — граф Дмитрий Николаевич Шереметев).

Количество крепостных: ~150 000 – 185 000 душ (мужского пола).
Владения: Огромные земли в Московской, Ярославской, Нижегородской и других губерниях. Самые богатые помещики России.

Гр. Воронцовы (и ветвь Воронцовых-Дашковых).

Количество крепостных: ~37 000 – 50 000 душ.
Владения: Огромные имения на юге России, в Крыму, а также в центральных губерниях.

Кн. Юсуповы (глава — князь Николай Борисович Юсупов-младший).

Количество крепостных: ~30 000 – 40 000 душ.
Владения: Земли в 17 губерниях, заводы, промыслы. Одна из богатейших семей, чье состояние продолжало расти вплоть до 1917 года.

Гр. Строгановы (граф Сергей Григорьевич Строганов и др. представители).

Количество крепостных: Совокупно клан владел свыше 150 000 душ (преимущественно в Пермской губернии), но значительная часть из них была приписана к заводам (горнозаводские крестьяне).
Владения: Фактически владели Уралом ("Пермский майорат").

Гр. Орловы-Давыдовы (граф Владимир Петрович Орлов-Давыдов).

Количество крепостных: ~36 000 душ.
Владения: Огромные земли в Поволжье (Симбирская, Самарская губернии), включая знаменитое имение Усолье.

2. Крупнейшие магнаты (более 10 000 душ)
В эту категорию входили представители высшей аристократии, занимавшие ключевые посты при дворе.

Кн. Гагарины — обширные владения в центральной России (около 15 000 – 20 000 душ у разных ветвей).
Нарышкины — старинный род, родственники Романовых. Владели десятками тысяч душ в разных губерниях (в том числе Эммануил Дмитриевич Нарышкин).
Кн. Голицыны — самый многочисленный княжеский род. Совокупно владели огромным количеством крестьян (более 100 000 на весь клан), отдельные представители (например, «прогрессивные» ветви) владели по 10 000 – 20 000 душ.
Демидовы (князья Сан-Донато) — как и Строгановы, владели огромными горнозаводскими округами на Урале и десятками тысяч приписных крестьян.
Кн. Барятинские (князь Александр Иванович Барятинский, наместник на Кавказе) — крупные имения в Курской губернии (Марьино), десятки тысяч душ.
Гр. Шуваловы — крупные землевладельцы и промышленники (Урал, Центральная Россия).
Кн. Долгоруковы — старинный род с обширными владениями (порядка 10 000+ душ).
Кн. Салтыковы (включая Светлейших князей) — владели крупными имениями в Черноземье.
Кн. Куракины («Бриллиантовые князья») — владения в Орловской, Саратовской губерниях.
Гр. Потоцкие — польские магнаты, сохранившие огромные латифундии на Правобережной Украине (Киевская, Подольская губернии) после разделов Польши.
Гр. Браницкие — еще один род польского происхождения с колоссальными владениями на Украине (Белая Церковь).

3. Представители «Топ-50» (Владельцы 5 000 – 10 000 душ)
Список фамилий, которые замыкали круг крупнейших душевладельцев (по данным на 1860 г.):

Гр. Бобринские (потомки Екатерины II и Г. Орлова) — крупные владения и сахарные заводы.
Гр. Толстые (не писательская ветвь, а более богатые линии, например, графы Остерман-Толстые).
Кн. Белосельские-Белозерские — богатейшие владельцы недвижимости и земель, включая Крестовский остров в Петербурге.
Гр. Апраксины.
Кн. Лобановы-Ростовские.
Кн. Мещерские.
Кн. Оболенские.
Гр. Панины (Виктор Никитич Панин был одним из авторов реформы, сам являясь крупным консервативным помещиком).
Гр. Разумовские.
Гр. Кушелевы-Безбородко.
Кн. Урусовы.
Кн. Трубецкие.
Кн. Щербатовы.
Мусины-Пушкины.
Гр. Уваровы.
Бахметевы (известные заводчики и помещики).
Гончаровы (родственники Пушкина, владельцы полотняных заводов и имений).
Мальцовы (крупные промышленники и землевладельцы, «Мальцовский заводской округ»).
Гр. Гудович.
Гр. Клейнмихель.
Гр. Зубовы (Платон Зубов и его наследники).
Дурново.
Кн. Васильчиковы.
Кн. Волконские.
Яковлевы (богатая династия заводчиков и помещиков, родственники Герцена).
Тургеневы (богатая симбирская ветвь рода, Николай Тургенев).
Столыпины (родственники Лермонтова и будущего реформатора, крупные землевладельцы в Поволжье).
Гр. Бенкендорфы.
Шиповы.
Полторацкие.
Бакунины (тверские помещики).
Олсуфьевы.
Гр. Самойловы.
Кн. Репнины.

Важное примечание
Всего в Российской империи накануне реформы насчитывалось около 100 000 помещиков.

Крупнопоместными (владевшими более 500 душ) были лишь около 3-4% дворян.
Магнаты (более 1000 душ) составляли менее 1%, но им принадлежало почти 30-40% всех крепостных крестьян страны.

Именно эти 50 семей фактически контролировали огромную часть земельного фонда и трудовых ресурсов империи.

То есть примерно то же самое. Где-то лучше, где-то хуже, но суть одна — использовать такие данные в серьезной работе нельзя.

Результат с Deep Research куда интереснее. Он искал данные минут 20, в процессе рассуждения бросался такими фразами: "Я приступаю к анализу структуры землевладения накануне отмены крепостного права, сосредоточившись на данных 10-й народной переписи 1858 года и материалах Редакционных комиссий 1860 года", "Для разрешения проблемы отсутствия готового консолидированного перечня я перехожу к глубокой проработке приложений к трудам Редакционных комиссий и академических работ историков-аграрников, таких как П. А. Зайончковский и Б. Г. Литвак.

Процесс рассуждения Gemini 3 Pro в режиме Deep Research

Результат с Deep Research куда интереснее. Он искал данные минут 20, в процессе рассуждения бросался такими фразами: "Я приступаю к анализу структуры землевладения накануне отмены крепостного права, сосредоточившись на данных 10-й народной переписи 1858 года и материалах Редакционных комиссий 1860 года", "Для разрешения проблемы отсутствия готового консолидированного перечня я перехожу к глубокой проработке приложений к трудам Редакционных комиссий и академических работ историков-аграрников, таких как П. А. Зайончковский и Б. Г. Литвак.

Процесс рассуждения Gemini 3 Pro в режиме Deep Research

Граф С.Д. Шереметев

Ничего себе проработка, да? Финальный результат — по этой ссылке: https://gemini.google.com/share/9c362b4f8d55.

Там и точные данные по числу крестьян, и анализ причин лидерства помещиков из топа, и ссылки на источники. В лидерах — снова С.Д. Шереметев с теми же 146853 душами крестьян, и снова итоговый текст выглядит очень академично и достоверно.

Что же не так?

А не так, например, то, что Сергею Дмитриевичу Шереметеву к 1860 г. было всего 16 лет, и в "Приложениях к трудам..." он не упоминается ни разу.

Граф С.Д. Шереметев

Ничего себе проработка, да? Финальный результат — по этой ссылке: https://gemini.google.com/share/9c362b4f8d55.

Там и точные данные по числу крестьян, и анализ причин лидерства помещиков из топа, и ссылки на источники. В лидерах — снова С.Д. Шереметев с теми же 146853 душами крестьян, и снова итоговый текст выглядит очень академично и достоверно.

Что же не так?

А не так, например, то, что Сергею Дмитриевичу Шереметеву к 1860 г. было всего 16 лет, и в "Приложениях к трудам..." он не упоминается ни разу.

Вот это поворот. Несмотря на якобы обращения к первоисточникам и к самому Зайончковскому бОльшая часть информации взята из статей, первооснову которых составила та же таблица из книги Ливена. А Ливен банально перепутал Сергея Дмитриевича и его отца — графа Дмитрия Николаевича Шереметева. Как перепутал еще много чего. Его данные, якобы основанные на "Приложениях...", попали в статьи, по оригиналам авторы статей не сверялись, в итоге всё попало в результаты от ИИ (все, как в обычных исследованиях, впрочем!).

Вывод по первому пункту такой: Современные ИИ-модели неплохо справляются с поиском в интернете, могут для одного запроса приводить ссылки, выстраивать выглядящий достоверно текст. Но полностью полагаться на его точность нельзя, как бы правдиво не выглядели рассуждения.

Лучший (хотя и неверный по сути) результат здесь показывает режим Deep Research oт Google Gemini 3 Pro, результаты от Perplexity и "обычного" Gemini — полнейшая ерунда.

Вот это поворот. Несмотря на якобы обращения к первоисточникам и к самому Зайончковскому бОльшая часть информации взята из статей, первооснову которых составила та же таблица из книги Ливена. А Ливен банально перепутал Сергея Дмитриевича и его отца — графа Дмитрия Николаевича Шереметева. Как перепутал еще много чего. Его данные, якобы основанные на "Приложениях...", попали в статьи, по оригиналам авторы статей не сверялись, в итоге всё попало в результаты от ИИ (все, как в обычных исследованиях, впрочем!).

Вывод по первому пункту такой: Современные ИИ-модели неплохо справляются с поиском в интернете, могут для одного запроса приводить ссылки, выстраивать выглядящий достоверно текст. Но полностью полагаться на его точность нельзя, как бы правдиво не выглядели рассуждения.

Лучший (хотя и неверный по сути) результат здесь показывает режим Deep Research oт Google Gemini 3 Pro, результаты от Perplexity и "обычного" Gemini — полнейшая ерунда.

Распознавание текстов книг

Едем дальше. Ну хорошо, Ливен ошибся, следом ошиблись все остальные, но табличку-то он интересную приводит. Можно ли ее распознать и перевести в табличку для Excel'я? Ну и вообще — можно ли весь текст книги распознать с помощью ИИ? "— Эй, Алиса, распознай-ка текст книги и дай мне его в виде вордовского файла?" — такое возможно?

И да, и нет.

Cкармливаем нескольким моделям (Chat GPT и Gemini) страницу с таблицей выше. Результат одинаково неплох — распознавание идет без существенных ошибок, четко разделяется обычный текст и таблицы. Но распознать так pdf-ку на 200-300 страниц, не удастся — такая pdf-ка сразу съест все токены и продвинуться не получится.

Вполне возможно распознавать частями — по 10-15 страниц, но даже это может оказаться перебором: любые модели могут зависнуть на середине процесса, поэтому лучше их особо не торопить. Серьезные полноценные модели, которые могли бы сразу распознавать тексты любого объема, мне не встречались, хотя вот буквально на днях вышла некая OCR-3 от Mistra l, которая в видосиках показывает какие-то чудеса распознавания, но полноценно потестировать ее мне не удалось.

В этой части процесса пора перейти от вроде как ошибочного Ливена к оригинальным "Приложениям к трудам..." (шеститомник, изданный в 1860 г.), и к другому источнику по статистике крепостных — книге А.Н. Тройницкого "Крепостное население в России по 10-й народной переписи" (1861 г.). "Приложения" почти полностью состоят из таблиц имений с указаниями владельцев и числом душ в них, книга Тройницкого — из подробного описания положения крепостных накануне отмены крепостного права и тоже из таблиц. Поехали распознавать!

Распознавание текстов книг

Едем дальше. Ну хорошо, Ливен ошибся, следом ошиблись все остальные, но табличку-то он интересную приводит. Можно ли ее распознать и перевести в табличку для Excel'я? Ну и вообще — можно ли весь текст книги распознать с помощью ИИ? "— Эй, Алиса, распознай-ка текст книги и дай мне его в виде вордовского файла?" — такое возможно?

И да, и нет.

Cкармливаем нескольким моделям (Chat GPT и Gemini) страницу с таблицей выше. Результат одинаково неплох — распознавание идет без существенных ошибок, четко разделяется обычный текст и таблицы. Но распознать так pdf-ку на 200-300 страниц, не удастся — такая pdf-ка сразу съест все токены и продвинуться не получится.

Вполне возможно распознавать частями — по 10-15 страниц, но даже это может оказаться перебором: любые модели могут зависнуть на середине процесса, поэтому лучше их особо не торопить. Серьезные полноценные модели, которые могли бы сразу распознавать тексты любого объема, мне не встречались, хотя вот буквально на днях вышла некая OCR-3 от Mistra l, которая в видосиках показывает какие-то чудеса распознавания, но полноценно потестировать ее мне не удалось.

В этой части процесса пора перейти от вроде как ошибочного Ливена к оригинальным "Приложениям к трудам..." (шеститомник, изданный в 1860 г.), и к другому источнику по статистике крепостных — книге А.Н. Тройницкого "Крепостное население в России по 10-й народной переписи" (1861 г.). "Приложения" почти полностью состоят из таблиц имений с указаниями владельцев и числом душ в них, книга Тройницкого — из подробного описания положения крепостных накануне отмены крепостного права и тоже из таблиц. Поехали распознавать!

Ну и не тут-то было. Со сложными таблицами "Приложений" нормально не справляется ни одна модель: играет роль их общая неидеальная структура, дореволюционная орфография, не всегда хорошее качество сканов.

С Тройницким чуть лучше — старая орфография внутри обычных текстов не помеха, но есть проблема откуда не ждали: в отдельных частях таблицы используется курсив, в котором не всегда даже человеку легко отличить "3" от "5", а "1", от "4", в результате распознавание дает недопустимое количество разночтений, которые затем приходится выверять вручную.

Вывод простой: на идеальных текстах — с идеальным качеством скана, с "идеальным" шрифтом, с более-менее понятной структурой — современные ИИ-модели показывают высокое качество распознавания. Но если что-то из этого неидеально — качество падает существенно.

И это я не говорю про распознавание рукописных текстов (одно из самых частых требований к тому, чего хотелось бы от ИИ). Распознавать рукописные тексты — даже в современной орфографии — обычные ИИ-модели не умеют вовсе. То, что уже привычно, от "Яндекса", т.е. распознанные документы, по которым можно вести поиск — это результат, достигнутый в т.ч. с помощью искусственного интеллекта, но гораздо более сложным путем, чем пока доступен в обычных моделях. Там это результат большого количества ручного обучения, "натаскивания" алгоритмов на отдельные элементы документа, сочетания букв и проч.

Вывод простой: на идеальных текстах — с идеальным качеством скана, с "идеальным" шрифтом, с более-менее понятной структурой — современные ИИ-модели показывают высокое качество распознавания. Но если что-то из этого неидеально — качество падает существенно.

И это я не говорю про распознавание рукописных текстов (одно из самых частых требований к тому, чего хотелось бы от ИИ). Распознавать рукописные тексты — даже в современной орфографии — обычные ИИ-модели не умеют вовсе. То, что уже привычно, от "Яндекса", т.е. распознанные документы, по которым можно вести поиск — это результат, достигнутый в т.ч. с помощью искусственного интеллекта, но гораздо более сложным путем, чем пока доступен в обычных моделях. Там это результат большого количества ручного обучения, "натаскивания" алгоритмов на отдельные элементы документа, сочетания букв и проч.

Структурирование данных

Наконец, то, в чем ИИ начинает проявляться в полной мере.

Напомню задачу: нужно собрать, структурировать и визуализировать данные о крупнейших помещиках перед реформой 1861 г. Данные Ливена мы отмели (там ошибки, да и их мало), остались "Приложения..." и общестатистические таблицы Тройницкого.

Медленно и несовременно мне все же удалось перевести общие данные Тройницкого по крепостным в каждом уезде в таблицы на Google Docs — пришлось, распознав их через Gemini, вручную сверять каждое число, исправляя ошибочные "5"-ки и "3"-ки. Попутно при этом обнаружилась масса особенностей. Тройницкий явно обобщал данные не с помощью ИИ, поэтому у него есть ошибки — например, указанные промежуточные суммы не всегда совпадают с реальными суммами слагаемых, в таблицах по уездам пропущен существовавший в 1860 г. Сургутский уезд Тобольской губернии, но приведен не существовавший к тому времени Колыванский уезд Томской губернии.

Что же до перевода в электронный вид таблиц из "Приложений...", то добиться сколько-нибудь внятного результата путем ИИ-распознавания не удалось. В процессе добивания обнаружилось, что сведения из этого источника уже переведены в электронный вид — на сайте Familio в разделе "Справочников". Гигантский труд был сделан, по-видимому, вручную и повторяет как многочисленные ошибки оригинала, так и добавляет новые. Так или иначе данные оттуда удалось перенести в тот же Google Docs (ИИ тут тоже помог — правильно сформулированный запрос после пары десятков итераций дал нужный результат).

Дальше самая интересная и долгая часть процесса. В "Приложениях" сведения об именах помещиков приведены как Бог на душу положит: "Гр. Дм. Ник. Шереметев", "Граф Дмитрий Николаевич Шереметев", "Гр. Дмитрий Ник. Шереметьев", "Димитрий Ник. Шерем-ьев" — по десятку, а то и больше вариантов одного имени. Как все это унифицировать? Данные уже в таблице, теоретически можно искать каждый вариант поиском по таблице и исправлять его на какой-то унифицированный. Но учтенных помещиков тысячи! Каждого так не унифицируешь, да и сходу в голову не придет искать вместо, например, Олсуфьева какого-нибудь Алсуфева.

Структурирование данных

Наконец, то, в чем ИИ начинает проявляться в полной мере.

Напомню задачу: нужно собрать, структурировать и визуализировать данные о крупнейших помещиках перед реформой 1861 г. Данные Ливена мы отмели (там ошибки, да и их мало), остались "Приложения..." и общестатистические таблицы Тройницкого.

Медленно и несовременно мне все же удалось перевести общие данные Тройницкого по крепостным в каждом уезде в таблицы на Google Docs — пришлось, распознав их через Gemini, вручную сверять каждое число, исправляя ошибочные "5"-ки и "3"-ки. Попутно при этом обнаружилась масса особенностей. Тройницкий явно обобщал данные не с помощью ИИ, поэтому у него есть ошибки — например, указанные промежуточные суммы не всегда совпадают с реальными суммами слагаемых, в таблицах по уездам пропущен существовавший в 1860 г. Сургутский уезд Тобольской губернии, но приведен не существовавший к тому времени Колыванский уезд Томской губернии.

Что же до перевода в электронный вид таблиц из "Приложений...", то добиться сколько-нибудь внятного результата путем ИИ-распознавания не удалось. В процессе добивания обнаружилось, что сведения из этого источника уже переведены в электронный вид — на сайте Familio в разделе "Справочников". Гигантский труд был сделан, по-видимому, вручную и повторяет как многочисленные ошибки оригинала, так и добавляет новые. Так или иначе данные оттуда удалось перенести в тот же Google Docs (ИИ тут тоже помог — правильно сформулированный запрос после пары десятков итераций дал нужный результат).

Дальше самая интересная и долгая часть процесса. В "Приложениях" сведения об именах помещиков приведены как Бог на душу положит: "Гр. Дм. Ник. Шереметев", "Граф Дмитрий Николаевич Шереметев", "Гр. Дмитрий Ник. Шереметьев", "Димитрий Ник. Шерем-ьев" — по десятку, а то и больше вариантов одного имени. Как все это унифицировать? Данные уже в таблице, теоретически можно искать каждый вариант поиском по таблице и исправлять его на какой-то унифицированный. Но учтенных помещиков тысячи! Каждого так не унифицируешь, да и сходу в голову не придет искать вместо, например, Олсуфьева какого-нибудь Алсуфева.

Пришлось идти несколькими путями — попроще и посложнее, оба с ИИ. Путь попроще — просто дать модели (пробовались ChatGPT и Gemini в режиме App).

Они оба относительно удачно находили даже совсем неочевидные потенциальные совпадения, которые простым перебором сделать бы точно не удалось.

Потенциальные совпадения, которые предлагал унифицировать Gemini

Пришлось идти несколькими путями — попроще и посложнее, оба с ИИ. Путь попроще — просто дать модели (пробовались ChatGPT и Gemini в режиме App).

Они оба относительно удачно находили даже совсем неочевидные потенциальные совпадения, которые простым перебором сделать бы точно не удалось.

Потенциальные совпадения, которые предлагал унифицировать Gemini

Но это только списки потенциальных правок. Напрямую заставить в чате менять данные в готовой таблице нельзя — вот тебе список, заменяй все сам, дорогой кожаный мешок. И тут на помощь приходит схема, в которой роль ИИ-моделей на мой взгляд существенно недооценена.

Если нельзя что-то сделать прямо, можно сделать в обход — просто попросив создать инструмент для реализации той или иной задачи.

Если нельзя заставить модель разом найти все потенциальные совпадения и унифицировать их, то можно попросить написать скрипт, сервис, приложение, которое это сделают уже не с помощью ИИ, а с помощью проверенных библиотек.

Но это только списки потенциальных правок. Напрямую заставить в чате менять данные в готовой таблице нельзя — вот тебе список, заменяй все сам, дорогой кожаный мешок. И тут на помощь приходит схема, в которой роль ИИ-моделей на мой взгляд существенно недооценена.

Если нельзя что-то сделать прямо, можно сделать в обход — просто попросив создать инструмент для реализации той или иной задачи.

Если нельзя заставить модель разом найти все потенциальные совпадения и унифицировать их, то можно попросить написать скрипт, сервис, приложение, которое это сделают уже не с помощью ИИ, а с помощью проверенных библиотек.

Примерный промт:

У меня есть таблица в Excel/Google Sheets, в которой собраны сведения о помещиках, владевших крепостными крестьянами в XIX веке. Это десятки и сотни отдельных имен и фамилий. Данные собраны так, что один и тот же человек может быть записан по-разному: например, как граф Лев Николаевич Толстой, Лев Ник. Толстой, Л.Н. Толстой, Лев Николаев. Толстой и т.п. Посмотри для примера часть таблицы: [100-200 строк из таблицы]. Мне нужен инструмент-приложение, которое проанализирует таблицу, соберет потенциальных "совпаденцев" на основе разных критериев, покажет мне совпаденцев в виде списка и даст вручную выбрать те варианты, которые я посчитаю реальным совпадением, и затем объединить их в таблицы на унифицированный вариант.

Как все работало в созданной программе.

Примерный промт:

У меня есть таблица в Excel/Google Sheets, в которой собраны сведения о помещиках, владевших крепостными крестьянами в XIX веке. Это десятки и сотни отдельных имен и фамилий. Данные собраны так, что один и тот же человек может быть записан по-разному: например, как граф Лев Николаевич Толстой, Лев Ник. Толстой, Л.Н. Толстой, Лев Николаев. Толстой и т.п. Посмотри для примера часть таблицы: [100-200 строк из таблицы]. Мне нужен инструмент-приложение, которое проанализирует таблицу, соберет потенциальных "совпаденцев" на основе разных критериев, покажет мне совпаденцев в виде списка и даст вручную выбрать те варианты, которые я посчитаю реальным совпадением, и затем объединить их в таблицы на унифицированный вариант.

Как все работало в созданной программе.

Дальше пришлось объединять или пропускать потенциальные совпадения (тысячи их! но несравнимо быстрее, чем через найти-заменить в Excel), время от времени варьируя степень "возможной похожести". Результат оказался достаточно удобоваримым. Вряд ли удалось объединить всех и вся (например, М. Голицын и Михаил Николаевич Голицын — это один и тот же человек, или нет; такие неочевидные варианты пропускались), но осмысленности и структурности в таблице стало на порядки больше.

Вывод проще прежнего: в структуризации и анализе данных ИИ незаменим — если чего-то нельзя сделать непосредственно в чате (например, перевести текст в таблицу там можно, а заставить заменять сотни строк — нельзя), то можно создать для этого дополнительный инструмент, функционал и сложность которого зависит, наверное, только от фантазии.

Дальше пришлось объединять или пропускать потенциальные совпадения (тысячи их! но несравнимо быстрее, чем через найти-заменить в Excel), время от времени варьируя степень "возможной похожести". Результат оказался достаточно удобоваримым. Вряд ли удалось объединить всех и вся (например, М. Голицын и Михаил Николаевич Голицын — это один и тот же человек, или нет; такие неочевидные варианты пропускались), но осмысленности и структурности в таблице стало на порядки больше.

Вывод проще прежнего: в структуризации и анализе данных ИИ незаменим — если чего-то нельзя сделать непосредственно в чате (например, перевести текст в таблицу там можно, а заставить заменять сотни строк — нельзя), то можно создать для этого дополнительный инструмент, функционал и сложность которого зависит, наверное, только от фантазии.

Визуализация данных

Почти всё! В этой части будут мои любимые карты и много табличек.

Данные нашли, худо-бедно распознали, не-худо-не-бедно и с большим количеством ручной работы перевели в "сырые" таблицы. Что с ними делать дальше? Ну, например, перевести некрасивые таблички в красивые. Это проще всего: "хочу такую-то таблицу, но чтобы было 3 колонки, номера строк в кружочках, первые три места в цвет золота-серебра-бронзы", и, пожалуйста, что-то такое. Это все тот же Ливен, только не в виде строчек из книги.

Визуализация данных

Почти всё! В этой части будут мои любимые карты и много табличек.

Данные нашли, худо-бедно распознали, не-худо-не-бедно и с большим количеством ручной работы перевели в "сырые" таблицы. Что с ними делать дальше? Ну, например, перевести некрасивые таблички в красивые. Это проще всего: "хочу такую-то таблицу, но чтобы было 3 колонки, номера строк в кружочках, первые три места в цвет золота-серебра-бронзы", и, пожалуйста, что-то такое. Это все тот же Ливен, только не в виде строчек из книги.

Крупнейшие русские помещики (1860)

Что еще? Конечно, показать на карте!

Карты я эксплуатирую примерно одни и те же — созданные 25 лет назад контуры губерний и уездов Российской империи по состоянию на 1897 год. В них множество мелких недочетов, которые я постепенно исправляю — от неправильных названий уездов (например, "Мещонский" в Калужской губернии, "Курмыжский" в Калужской и т.п.) до отображения никогда не существоваших уездов (например, Еланский уезд в Саратовской губернии я отловил только сейчас).

Представлять на карте 1897 года данные из 1860-го, конечно, не совсем верно. Некоторые уезды-1897 еще не существовали в 1860 г., и наоборот. По-хорошему надо заново их отрисовать для каждого исторического периода.

Виды картографически визуализаций могут быть в общем какие угодно, но здесь хорошего готового решения ИИ может вовсе не предложить — любая такая визуализация это череда проб и ошибок, доделок и переделок. Другое дело, что однажды достигнув устраивающего результата, можно в следующих вариантах давать его ИИ в виде референса — "хочу, чтобы кнопки были такими же, но с перламутровым отливом". При наличии референсов модели справляются с визуализациями гораздо лучше, хотя и здесь проявляется основная их боль и печаль — галлюцинации; когда в визуализацию добавляется то, чего не просили, убирается то, что десять раз прошено не убирать и т.п.

В общем, долго ли коротко таблицы Тройницкого с нечитаемыми пятерками и единичками превращаются вот в это — тепловую карту с поуездными данными по числу крепостных (некоторые уезды не существовали в 1897 г. и их на карте нет — это серьезное поле для доработки; например, отсутствует Миусский округ — один из лидеров по числу крепостных).

Что еще? Конечно, показать на карте!

Карты я эксплуатирую примерно одни и те же — созданные 25 лет назад контуры губерний и уездов Российской империи по состоянию на 1897 год. В них множество мелких недочетов, которые я постепенно исправляю — от неправильных названий уездов (например, "Мещонский" в Калужской губернии, "Курмыжский" в Калужской и т.п.) до отображения никогда не существоваших уездов (например, Еланский уезд в Саратовской губернии я отловил только сейчас).

Представлять на карте 1897 года данные из 1860-го, конечно, не совсем верно. Некоторые уезды-1897 еще не существовали в 1860 г., и наоборот. По-хорошему надо заново их отрисовать для каждого исторического периода.

Виды картографически визуализаций могут быть в общем какие угодно, но здесь хорошего готового решения ИИ может вовсе не предложить — любая такая визуализация это череда проб и ошибок, доделок и переделок. Другое дело, что однажды достигнув устраивающего результата, можно в следующих вариантах давать его ИИ в виде референса — "хочу, чтобы кнопки были такими же, но с перламутровым отливом". При наличии референсов модели справляются с визуализациями гораздо лучше, хотя и здесь проявляется основная их боль и печаль — галлюцинации; когда в визуализацию добавляется то, чего не просили, убирается то, что десять раз прошено не убирать и т.п.

В общем, долго ли коротко таблицы Тройницкого с нечитаемыми пятерками и единичками превращаются вот в это — тепловую карту с поуездными данными по числу крепостных (некоторые уезды не существовали в 1897 г. и их на карте нет — это серьезное поле для доработки; например, отсутствует Миусский округ — один из лидеров по числу крепостных).

А сведения из сборников о работе редакционных комиссий — вот в это. Все (ну, большинство) имена унифицированы, все крупные имения (ну, тоже явно не все) учтены, и тут наконец становится возможным сравнить данные с тех, с которых мы начали — с вроде как ошибочной таблицы Ливена.

И станет видно, что по крайней мере в верхней своей части она не так уж и плоха. Шереметев хотя и не тот, что нужно, но количество крестьян посчитано почти идентично, следующая тройка помещиков верна. Но у автора ИИ же не было!

Итоги, кстати, получаются довольно любопытные. В крупнейшем имении на момент отмены крепостного права — 38 тысяч крестьян мужского пола, "бронзовая" графиня Строганова всеми крестьянами владела в рамках нескольких уездов одной Пермской губернии, "серебряный" Витгенштейн взял серебро засчет десятков скученных имений в западных губерний (ну и за счет тому, что ему, как у большинства соседей в счет шли не только мужчины-крепостные, но и женщины). Есть что пощелкать и подвигать.

А сведения из сборников о работе редакционных комиссий — вот в это. Все (ну, большинство) имена унифицированы, все крупные имения (ну, тоже явно не все) учтены, и тут наконец становится возможным сравнить данные с тех, с которых мы начали — с вроде как ошибочной таблицы Ливена.

И станет видно, что по крайней мере в верхней своей части она не так уж и плоха. Шереметев хотя и не тот, что нужно, но количество крестьян посчитано почти идентично, следующая тройка помещиков верна. Но у автора ИИ же не было!

Итоги, кстати, получаются довольно любопытные. В крупнейшем имении на момент отмены крепостного права — 38 тысяч крестьян мужского пола, "бронзовая" графиня Строганова всеми крестьянами владела в рамках нескольких уездов одной Пермской губернии, "серебряный" Витгенштейн взял серебро засчет десятков скученных имений в западных губерний (ну и за счет тому, что ему, как у большинства соседей в счет шли не только мужчины-крепостные, но и женщины). Есть что пощелкать и подвигать.

Карта Помещиков 1860

Бонусом — вот такая штука, тоже сделанная не без ИИ. Это отабличенная версия описей фонда 577 РГИА (Главное выкупное учреждение), в которой удобно и просто искать сведения о помещиках, владевших крестьянами на излете крепостного права. Здесь уже не только крупные имения, есть возможность быстро найти "свои" деревни и "своих" помещиков.

Каталог архивных дел

Главное выкупное учреждение Министерства финансов (РГИА)

Еще один бонус — ИИ-инфографика от NotebookLM (это тоже Google). Этот ИИ-извод позволяет рисовать инфографику, делать презентации (в т.ч. аудио и видео) на основе загруженных файлов. Тут на входе — excel-табличка на основе данных Тройницкого, а на выходе вот такая картинка.

Небольшой лайфхак: лучше инфографика делается, если задать в настройках не русский, а английский язык. А потом попросить Nano Banana 2 полученную картинку перевести на русский. Без такого лайфхака надписи на русском выглядят как абракадабра.

Еще один бонус — ИИ-инфографика от NotebookLM (это тоже Google). Этот ИИ-извод позволяет рисовать инфографику, делать презентации (в т.ч. аудио и видео) на основе загруженных файлов. Тут на входе — excel-табличка на основе данных Тройницкого, а на выходе вот такая картинка.

Небольшой лайфхак: лучше инфографика делается, если задать в настройках не русский, а английский язык. А потом попросить Nano Banana 2 полученную картинку перевести на русский. Без такого лайфхака надписи на русском выглядят как абракадабра.

Выводы

А выводы всему этому написал Gemini (узнаете его по любви к маркированным спискам и к конструкции "Это не..., а...").

Подводя итог эксперименту по поиску и обработке данных о помещичьих имениях 1860 года, можно выделить несколько ключевых аспектов использования ИИ в исторических и генеалогических исследованиях:

Поиск и проверка сведений: Современные ИИ-модели (ообенно в режиме Deep Research) демонстрируют впечатляющую скорость сбора информации, однако они склонны тиражировать и «узаконивать» ошибки из литературы (например, путаницу между отцом и сыном Шереметевыми). ИИ на данном этапе — это мощный поисковик, но крайне ненадежный эксперт, требующий тотального фактчекинга.
Распознавание текстов (OCR): Технология отлично справляется с печатными таблицами идеального качества, но пасует перед дореволюционной орфографией, сложной версткой и курсивом. Для масштабных архивных работ ИИ пока остается инструментом «чернового» распознавания, требующим кропотливой ручной выверки.
Структурирование данных: Это самая сильная сторона ИИ. Нейросети незаменимы для унификации тысяч разнородных записей (например, приведения десятков вариантов написания одной фамилии к единому стандарту). Даже если модель не может обработать таблицу напрямую, она способна выступить «архитектором», написав программный код для решения узкоспециализированной задачи.
Визуализация: ИИ позволяет за считанные минуты превращать «сухие» массивы данных в интерактивные карты и инфографику. Это значительно повышает наглядность исследования, хотя и требует от исследователя наличия готовых референсов и четких инструкций для борьбы с «визуальными галлюцинациями» моделей.

Общий итог: ИИ сегодня — это не замена исследователю, а эффективный «соавтор-подмастерье». Он радикально ускоряет рутинные процессы (сортировку, кодинг, первичный поиск), но финальная ответственность за историческую достоверность по-прежнему лежит на человеке. Мы находимся в точке, где ИИ уже может построить сложнейший инструмент для анализа прошлого, но всё еще не может гарантировать точность каждой цифры в нем.

Выводы

А выводы всему этому написал Gemini (узнаете его по любви к маркированным спискам и к конструкции "Это не..., а...").

Подводя итог эксперименту по поиску и обработке данных о помещичьих имениях 1860 года, можно выделить несколько ключевых аспектов использования ИИ в исторических и генеалогических исследованиях:

Поиск и проверка сведений: Современные ИИ-модели (ообенно в режиме Deep Research) демонстрируют впечатляющую скорость сбора информации, однако они склонны тиражировать и «узаконивать» ошибки из литературы (например, путаницу между отцом и сыном Шереметевыми). ИИ на данном этапе — это мощный поисковик, но крайне ненадежный эксперт, требующий тотального фактчекинга.
Распознавание текстов (OCR): Технология отлично справляется с печатными таблицами идеального качества, но пасует перед дореволюционной орфографией, сложной версткой и курсивом. Для масштабных архивных работ ИИ пока остается инструментом «чернового» распознавания, требующим кропотливой ручной выверки.
Структурирование данных: Это самая сильная сторона ИИ. Нейросети незаменимы для унификации тысяч разнородных записей (например, приведения десятков вариантов написания одной фамилии к единому стандарту). Даже если модель не может обработать таблицу напрямую, она способна выступить «архитектором», написав программный код для решения узкоспециализированной задачи.
Визуализация: ИИ позволяет за считанные минуты превращать «сухие» массивы данных в интерактивные карты и инфографику. Это значительно повышает наглядность исследования, хотя и требует от исследователя наличия готовых референсов и четких инструкций для борьбы с «визуальными галлюцинациями» моделей.

Общий итог: ИИ сегодня — это не замена исследователю, а эффективный «соавтор-подмастерье». Он радикально ускоряет рутинные процессы (сортировку, кодинг, первичный поиск), но финальная ответственность за историческую достоверность по-прежнему лежит на человеке. Мы находимся в точке, где ИИ уже может построить сложнейший инструмент для анализа прошлого, но всё еще не может гарантировать точность каждой цифры в нем.