LibRusLib
Четверг, 28.03.2024, 20:20
Приветствую Вас Гость | RSS
 
Главная ФорумРегистрацияВход
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
Форум » LibGen - Библиотекарь » Разработка » Разработка, проблемы, вопросы, планы и пожелания. (Разработка, проблемы, вопросы, планы и пожелания.)
Разработка, проблемы, вопросы, планы и пожелания.
drserjДата: Четверг, 19.05.2011, 21:48 | Сообщение # 46
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Quote (arnym23)
Говоря о нынешней фиче Печати Отчёта, хотелось бы иметь возможность менять размер столбцов, выбирать их перечень, печатать в каждом поле одной карточки в несколько строк (чтобы видеть весь контент поля), и продолжать печать карточки с одной Альбомной страницы на другую (т.е. в разворот смежных альбомных страниц), чтобы видны было все поля целиком, а не по несколько букв из каждого.

а кто мешает? Отчет строится по таблице, которая печатается. Убери на время печати ненужное, настрой как хош и вперед.

Quote (arnym23)
Подскажите, как с этим бороться?

абсолютно никак, если хотеть сохранения мд5. как вариант - хранить отдельно правильные обложки.

Quote (arnym23)
Кстати, как после редактирования закачать книгу на сервер Genesis, чтобы они включили её в обновленную базу с новым MD5?

не знаю, не заливал...


drSerj
 
arnym23Дата: Четверг, 19.05.2011, 22:01 | Сообщение # 47
Лейтенант
Группа: Пользователи
Сообщений: 53
Репутация: 0
Статус: Offline
Не нашёл никакой возможности регулировать размеры колонок с инфой юзером в предлагаемом урезанном варианте отчетника. Рискну задать вопрос ещё разок: в какой проге можно открыть или импортировать rps файл? Google даёт необычно скудную подсказку на этот счёт. Неужели военная тайна? smile
 
VV123Дата: Четверг, 19.05.2011, 22:10 | Сообщение # 48
Генерал-майор
Группа: Проверенные
Сообщений: 304
Репутация: 2
Статус: Offline
Quote (arnym23)
Кстати, как после редактирования закачать книгу на сервер Genesis, чтобы они включили её в обновленную базу с новым MD5?

А вот этого делать не надо!
Причина в том что на либгене люди тратят свое время на то чтобы избавляться от смысловых дублей книг, коих в базе по разным оценкам от 20% до 40%.

Добавлено (19.05.2011, 21:10)
---------------------------------------------

Quote (VV123)
Не нашёл никакой возможности регулировать размеры колонок с инфой юзером в предлагаемом урезанном варианте отчетника

Это делается в основном окне программы, отчет формируется по виду текущей таблицы "поиск", "группы" и т.д.
 
drserjДата: Четверг, 19.05.2011, 23:06 | Сообщение # 49
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Quote (VV123)
Это делается в основном окне программы, отчет формируется по виду текущей таблицы "поиск", "группы" и т.д.

Плюс к тому - включить перенос строк в таблице.


drSerj
 
arnym23Дата: Пятница, 20.05.2011, 10:17 | Сообщение # 50
Лейтенант
Группа: Пользователи
Сообщений: 53
Репутация: 0
Статус: Offline
Дело в том, что книги написаны не людьми, сортирующими их на либгене, и даже сканированы не ими. База используется множеством коммерческих сайтов, добавляющих всякую рекламную чушь в текст книги без согласия автора и издателя, а также без согласия и ведома читателя. Это затрудняет работу читателя с книгой, и их автоматиззированную обработку. Так что если уж избавляться от "смысловых дублей", так способом удаления либо чужой рекламы из книг, либо книг с чужой рекламой, если есть альтернатива.

Сообщение отредактировал arnym23 - Пятница, 20.05.2011, 10:18
 
VV123Дата: Пятница, 20.05.2011, 11:40 | Сообщение # 51
Генерал-майор
Группа: Проверенные
Сообщений: 304
Репутация: 2
Статус: Offline
Quote (arnym23)
Дело в том, что книги написаны не людьми, сортирующими их на либгене, и даже сканированы не ими. База используется множеством коммерческих сайтов, добавляющих всякую рекламную чушь в текст книги без согласия автора и издателя, а также без согласия и ведома читателя. Это затрудняет работу читателя с книгой, и их автоматиззированную обработку. Так что если уж избавляться от "смысловых дублей", так способом удаления либо чужой рекламы из книг, либо книг с чужой рекламой, если есть альтернатива.

1. База в основном заполнялась из крупных и мелких библио сайтов в автоматическом режиме, что там было на этих сайтах то в базу и попало, каждый экземпляр ни кто не просматривал.
2. Записи в базе не удаляются, т.е. усложните себе же дальнейшее пользование базой.
3. В базе либгена на текущий момент 401805 записей, через вэб морду загрузка + заполнение полей 5-20 мин. на одну запись, думаю через несколько дней желание отпадет даже на загрузку отсутствующих в базе книг smile
4. drserj, сейчас занимается мультилибом, в котором будет возможность заполнять свою базу, вот там и развлекайтесь. smile
5. Если этих аргументов не достаточно то вам сюда http://gen.lib.rus.ec/forum/ там узнаете что есть много других не менее важных задач, чем увеличивать кол-во дублей.
 
drserjДата: Пятница, 20.05.2011, 14:50 | Сообщение # 52
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Quote (VV123)
через вэб морду загрузка + заполнение полей 5-20 мин. на одну запись

оптимистично smile С заливкой, я бы сказал, пару часов на среднего объема книгу smile


drSerj
 
VV123Дата: Пятница, 20.05.2011, 18:45 | Сообщение # 53
Генерал-майор
Группа: Проверенные
Сообщений: 304
Репутация: 2
Статус: Offline
Quote (drserj)
оптимистично С заливкой, я бы сказал, пару часов на среднего объема книгу

у меня так получается smile , не знаю может от провайдера зависит.

по ходу хотел узнать, ежели в либгене привязка к мд5, то почему нельзя удалять строки как в экселе?
в торрентах ид уже давно не совпадает.

и еще, в поле "аннотации" программа перевод строки не отрабатывает или так в базе, когда редактирую через вэб морду перевод строки вроде есть.

Сообщение отредактировал VV123 - Пятница, 20.05.2011, 18:49
 
arnym23Дата: Пятница, 20.05.2011, 18:56 | Сообщение # 54
Лейтенант
Группа: Пользователи
Сообщений: 53
Репутация: 0
Статус: Offline
VV123

В принципе, скорость скачивания книг меня не очень волнует, поскольку книжной коммерцией не занимаюсь, и для решения круга моих текущих задач важно не количество скачанных книг, а качество их содержания. Книга для меня - помощник и источник инфы. Физически один человек может потреблять по назначению очень небольшое число книг, если цель - не выкладывать на сайтах для извлечения прибыли. Одна книга скачивается с Genesis в среднем за 10 мин, причём качать можно несколько параллельно. Это если не хотите смотреть на рекламу на обменниках.

В Genesis не только много дубликатов разного качества сканирования, но ещё больше книг с явно устаревшей информацией - это если пользовать их по назначению. Поэтому не вижу особой логики в закачке всей коллекции Genesis. Вот как раз LibGen, как сейчас убеждаюсь, и помогает порыться в ней предварительно. Для себя вижу 2 проблемы с Genesis:

- дубликаты книг не удаляются с сайта и не ранжируются по качеству сканирования. Образцы отсканированных страниц каждой книги на сайте не предлагаются. Т.е. хочешь выбрать - качай все копии.

- очень медленно идёт работа по выбору OCR софта для оцифровки текста с целью предложить полнотекстовый поиск в коллекции через веб-интерфейс, а затем возможно и удалённо через проги типа LibGen.

Добавку обложки, оглавления и аннотации, и удаление сторонней рекламы из книг развлечением не считаю. Если для вас это мелочи, спросите авторов, редакторов в издательствах, библиотекарей и владельцев книжных магазинов - они то знают потребности читателeй. А обзоры лучших, включая новые, книг по тематикам в инете найти очень непросто.

Если вы из 30 книг с названием "C++" можете сходу выбрать по этому названию или одному из группы авторов нужную - удачи. Но прежде надо определиться, для чего вы сами собираете книги (если собираете), и сколько из общего количества реально используете, а потом критиковать других.

Но для тех, кто реально использует книги для продвижения знаний - проблема в другом. Нужных книг в Genesis часто не оказывается, особенно монографий и новых на иностранных языках, да и на русском. А с другими сайтами, где их можно найти, проги типа LibGen не дружат, т.е. инфу надо вводить вручную, хотя скачать её можно из известных мест типа Amazon, РГБ, Lib of Congress, World Cat. Поэтому нужен каталогер технической литературы с плагинами, не замкнутый только на 3 базы.

Сообщение отредактировал arnym23 - Суббота, 21.05.2011, 05:22
 
drserjДата: Пятница, 20.05.2011, 19:14 | Сообщение # 55
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Quote (VV123)
по ходу хотел узнать, ежели в либгене привязка к мд5, то почему нельзя удалять строки как в экселе?

не совсем понял вопрос...

Quote (VV123)
в торрентах ид уже давно не совпадает.

совпадает

Quote (VV123)
и еще, в поле "аннотации" программа перевод строки не отрабатывает или так в базе, когда редактирую через вэб морду перевод строки вроде есть.

это зависит от содержимого поля "аннотации", вполне вероятно, там не виндовый а линуховый перевод...


drSerj
 
drserjДата: Пятница, 20.05.2011, 19:16 | Сообщение # 56
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Quote (arnym23)
нужен каталогер технической литературы с плагинами, не замкнутый только на 3 базы.

может и нужен... вот кому он нужен - и будет писать грабер-парсер...


drSerj
 
VV123Дата: Пятница, 20.05.2011, 19:52 | Сообщение # 57
Генерал-майор
Группа: Проверенные
Сообщений: 304
Репутация: 2
Статус: Offline
Quote (drserj)
не совсем понял вопрос...

где-то проскакивала твоя фраза что в БД нельзя сделать "дефрагментацию", т.е. когда все привязано к сквозной нумерации типа ид или букид все понятно, а в БД либгена привязка полей к мд5 и от того какой будет ид ни чего не изменится.

торренты я имел ввиду либгеновские и там уже в 0 всего 996 файлов, а ид 1000-1003 имеет в поле "имя файла" 0\<md5>
из-за этого и возник вопрос про удаление строк в БД.

arnym23,
это все лирика, здесь форум про разработку программ, а с вашими мыслями в слух на тот форум http://gen.lib.rus.ec/forum/ там разработчики и обработчики самой базы генезис им и жалуйтесь smile

Сообщение отредактировал VV123 - Пятница, 20.05.2011, 19:52
 
arnym23Дата: Пятница, 20.05.2011, 19:56 | Сообщение # 58
Лейтенант
Группа: Пользователи
Сообщений: 53
Репутация: 0
Статус: Offline
Quote (drserj)
вот кому он нужен - и будет писать грабер-парсер...

В реальной жизни каждый специализируется на чём то, то бишь профессии. Изменить это не так просто при всём желании. Кто-то хочет летать в космос, а посылают других (если денег нет на такое развлечение). smile

VV123

Для вас это лирика, поскольку книги вы похоже не используете по назначению - как источник знаний - такое сложилось впечатление. smile

Сообщение отредактировал arnym23 - Пятница, 20.05.2011, 20:07
 
drserjДата: Пятница, 20.05.2011, 19:56 | Сообщение # 59
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Quote (VV123)
где-то проскакивала твоя фраза что в БД нельзя сделать "дефрагментацию", т.е. когда все привязано к сквозной нумерации типа ид или букид все понятно, а в БД либгена привязка полей к мд5 и от того какой будет ид ни чего не изменится.

id - это уникальный номер, соответствующий номеру записи. Уникальность может определяться как сквозной нумерацией (типа либруса) так и любым алгоритмом формирования неповторяющейся последовательности символов (как мд5 в либгене)

Quote (VV123)
торренты я имел ввиду либгеновские и там уже в 0 всего 996 файлов, а ид 1000-1003 имеет в поле "имя файла" 0\<md5> из-за этого и возник вопрос про удаление строк в БД.

если есть несоответствие базы с контентом - это начало конца либгена


drSerj
 
VV123Дата: Пятница, 20.05.2011, 20:18 | Сообщение # 60
Генерал-майор
Группа: Проверенные
Сообщений: 304
Репутация: 2
Статус: Offline
Quote (drserj)
если есть несоответствие базы с контентом - это начало конца либгена

я бы сказал конец был в самом начале smile , из-за спешки были сделаны стратегические ошибки, и что самое не приятное они продолжают их накапливать а на предложение привести это все в порядок отсылают на вэб морду, так что вся надежда на тебя с мультилибом.

еще вопрос, возможно ли в перспективе формировать группы и подгруппы из поля "раздел", я сейчас в меру сил редактирую через вэб морду, мог бы по ходу и это поле приводить к некоему виду который будет понимать твоя программа интересует как делать разделители, названия в соответствии с языком, за основу наверное колхозный вариант взять?

 
Форум » LibGen - Библиотекарь » Разработка » Разработка, проблемы, вопросы, планы и пожелания. (Разработка, проблемы, вопросы, планы и пожелания.)
Поиск:

Copyright LibRusLib © 2024