Обсуждение проекта
| |
drserj | Дата: Понедельник, 31.10.2016, 21:26 | Сообщение # 1 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Unilib - программа для создания локальных библиотек.
Unilib представляет собой развитый офлайновый каталогизатор локальной библиотеки с автоматизированной пакетной обработкой импортируемых книг. Программа позволяет производить автоматический отбор книг по критериям, заданным пользователем, отсеивать дубликаты и.т.д.
Особенности Unilib-а:
1) Поддержка нескольких библиотек. 2) Импорт/экспорт личных данных. 3) Возможность обмена данными с другими библиотеками Unilib.
Ориентировочная структура БД
Структура модуля импорта
|
|
| |
drserj | Дата: Воскресенье, 09.04.2017, 16:07 | Сообщение # 61 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Вопрос сложный, учитывая что издательства публикуют книги под псевдонимами авторов и только иногда указывают их подлинные имена и другие, имеющиеся у автора псевдонимы. Тем более, что использовать псевдоним - это, прежде всего, желание самого автора скрыть свое подлинное имя. Могут быть и другие мотивы: поработать в другом жанре под другим именем и т.д. Не, ну тут как раз проблемы нет, ибо привязку псевдонима делаем мы сами при редактировании. Пока не стоит признак псевдонима - автор считается полноценным.
Цитата PFN ( ) Если изменять псевдоним на реальное имя автора в книге, то это может затруднить каталогизацию книг и затруднить отсев дубликатов. В книге - не надо, я про базу. Книги изменять - вообще моветон. Так наплодится туева хуча псевдодубликатов с идентичным содержимым но разным описанием. Дубликаты же при импорте следующей порции отсеиваются скорее по хэшу. Про дубликаты, кста, тоже будут вопросы, но позже.
Цитата PFN ( ) Поэтому придется, как ни "больно", псевдоним выводить, как полноценного автора. Не, ну я могу и настроечку добавить... Собственно, Полноценный автор - это автор, у которого ParrentID равен нулю, а псевдоним - у которого ParrentID равен ID автора. Это как вариант. И вывести всех или только авторов, у которых ParrentID=0 - не есть проблема. Просто сейчас идет доработка формата базы. Пока еще ее можно модернизировать. Потом, когда будет написана обвязка - будет достаточно сложно что-либо изменить.
Цитата PFN ( ) Если кого-то интересует инфа об авторе, то пусть пошарит по инету... корона не упадет :))) Как бы и да, но это же программа, к инету не привязанная, да и может не быть в инете об авторе инфы...
Цитата PFN ( ) И тут без правки самой книги не обойтись, т.к. корректировка информации об авторе только в базе окончательно проблемы не решит... Хм... Я в принципе не согласен. Допускаю, что можно доработать экспорт книги с правленой информацией, но хранить исправленную... Всё-таки лучше хранить исходный материал... Почему я против правок - изменяется мд5 и соответственно может импортироваться дубликат.
По поводу Стоплиста... Как я понял, это список исключений, файлов, которые уже отработаны? Я не совсем доволен своей идеей и ее реализацией. Может появились какие-нибудь варианты как исключить обработанные файлы?
По поводу некорректности ФИО у издателей - дык редактирование для того и надоть, что бы в базу вносить изменения... т.е. ответственность за некорректность ложится на плечи пользователя. Импорт - только помощь для занесения общей массы данных, а затем - доработка напильником
Кстати, давно зреет желание к обмену данными между пользователями... Ведь у многих есть то, что ищет кто-то и не может найти в общем доступе... Можно было бы организовать подобный обмен... Например, поставив отметки на материалах, которые могли бы получить другие пользователи... Т.е. возможный обмен базами...
drSerj
|
|
| |
PFN | Дата: Воскресенье, 09.04.2017, 23:56 | Сообщение # 62 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) Книги изменять - вообще моветон. Так наплодится туева хуча псевдодубликатов с идентичным содержимым но разным описанием.
Цитата drserj ( ) Допускаю, что можно доработать экспорт книги с правленой информацией, но хранить исправленную... Всё-таки лучше хранить исходный материал... Почему я против правок - изменяется мд5 и соответственно может импортироваться дубликат. Согласен, для тех, кто обновляет базу программой онлайн, правка книг неприемлема... Но я со своей локальной базой правлю книги не оглядываясь на МД5, т.к. потом МД5 пересчитывается и заносится в Стоплист после правки при добавлении книги в библиотеку. Правда времени на это уходит много... Но я - это частный случай, а программа должна ориентироваться на интересы большинства...
Цитата drserj ( ) По поводу Стоплиста... Как я понял, это список исключений, файлов, которые уже отработаны? Я не совсем доволен своей идеей и ее реализацией. Может появились какие-нибудь варианты как исключить обработанные файлы? Мне кажется, что Отсев дублей по МД5 - самый оптимальный вариант. Вот у меня при предварительном отборе из архива 5-ти тысячника сразу отсеивается порядка 2-х тысяч. Потом, при ручном отборе (только по названию) отсеивается приблизительно еще 1,5 - 2 тысячи. И оставшиеся после правок и пересчета МД5 заносятся в базу.
Цитата drserj ( ) Кстати, давно зреет желание к обмену данными между пользователями... Ведь у многих есть то, что ищет кто-то и не может найти в общем доступе... Можно было бы организовать подобный обмен... Идея интересная... Правда я смутно представляю механизм ее реализации... Во всяком случае какая-то "Доска объявлений" должна быть... А для получения искомого придется делать что-то вроде торента или использовать Я-диск\Гугл-диск...
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
drserj | Дата: Понедельник, 10.04.2017, 10:26 | Сообщение # 63 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Мне кажется, что Отсев дублей по МД5 - самый оптимальный вариант.
Не, сам механизм отсева серьезных вопросов пока не вызывает. Вызывает вопросы механизм списка исключений обработанных файлов. Он будет разрастаться и тормозить работу программы, занимать место на диске. А инфа, зачастую, нафиг не нужна. Этот механизм востребован тогда и только тогда, если сканируется один и тот же каталог, который тупо пополняется. Т.е. если производить нормальный импорт из какого-то стороннего каталога, который потом будет опустошаться - такое отслеживание не нужно абсолютно. Так же оно не нужно, если каталог сканируется разово и больше не изменяется. В идеале - библиотека должна иметь структуру папок контента %Z - тогда вообще большинство проблем исчезает. Но найдется часть пользователей (которых я тоже могу понять), которые не захотят менять структуру библиотеки. И вот тут-то и возникнут вопросы.
Итак, нужен всё-же механизм списка исключений, или в угоду качеству мы его (сорри за каламбурчик) исключаем?
drSerj
|
|
| |
PFN | Дата: Понедельник, 10.04.2017, 13:04 | Сообщение # 64 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) Вызывает вопросы механизм списка исключений обработанных файлов. Он будет разрастаться и тормозить работу программы, занимать место на диске. А инфа, зачастую, нафиг не нужна. Если я правильно понял, то получается, что механизм отсева дублей и механизм исключения - это не одно и то же. Выходит, что механизм исключений при попытке выбрать книгу в базе каждый раз сканирует все файлы/архивы, для исключения ненужных? В таком виде он действительно будет выступать тормозом. Я считал, что инфа из таблицы skipfile используется только при проверке новых книг, пополняющих базу. А все отсеянные дубли (физические файлы) просто удаляются с диска. Для более правильного понимания проблемы, пожалуйста, распишите подробней алгоритм работы этого механизма.
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
drserj | Дата: Понедельник, 10.04.2017, 13:25 | Сообщение # 65 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Для более правильного понимания проблемы, пожалуйста, распишите подробней алгоритм работы этого механизма.
Всё расписано выше. При сканировании папки, просканированные файлы заносятся в список исключений. Такой механизм имеет место быть для того, что бы пользователи могли пополнять один и тот же каталог новыми книгами, но они больше не обрабатывались. Если бы пользователь разово сканировал этот каталог, или после импорта порции книг, эти файлы удалялись (переносились в другой каталог, где расположен основной контент) - проблем бы не было. Занесение в список исключений - только для одной дибильной ситуации с пополнением одного и того же каталога и его пересканирование.
drSerj
|
|
| |
PFN | Дата: Понедельник, 10.04.2017, 18:29 | Сообщение # 66 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) При сканировании папки, просканированные файлы заносятся в список исключений. Такой механизм имеет место быть для того, что бы пользователи могли пополнять один и тот же каталог новыми книгами, но они больше не обрабатывались. Если бы пользователь разово сканировал этот каталог, или после импорта порции книг, эти файлы удалялись (переносились в другой каталог, где расположен основной контент) - проблем бы не было. Кажется я немного неправильно представлял себе алгоритм работы программы при создании локальной библиотеки и последующим добавлением новых книг. Сейчас попробую проверить несколько моментов...
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
drserj | Дата: Понедельник, 10.04.2017, 19:44 | Сообщение # 67 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| ждемс...
drSerj
|
|
| |
PFN | Дата: Среда, 12.04.2017, 14:27 | Сообщение # 68 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) ждемс... Читал и несколько раз перечитывал Help. Попробовал 2 варианта создания локальной библиотеки и добавления в нее новых книг. 1. На диске есть файлы книг уже разложенные по папкам. См. картинку.
При создании библиотеки соответственно указывается путь к архивам коллекции "Е:\Книги". Этот же путь указывается и для сканирования по команде "Импортировать базу". Соответственно заполняются таблицы "Успешно добавленные" и "Список исключений" Теперь с базой уже можно работать: править, создавать группы и т.д. Теперь актуальным становится вопрос пополнения библиотеки, исключив при этом возможные дубликаты. Это значит, что все новые книги должны пройти проверку по МД5, уже имеющихся в "Списке исключений". У меня новые книги располагаются на другом диске. См. картинку. Все сканируется, заносятся данные в таблицы "Успешно добавленные" и "Список исключений". Теперь, чтобы увидеть новые книги в базе нужно в настройках указать новый путь к архивам. А мне нужно, чтобы новые книги разложились по имеющимся папкам авторов. Получается, что я должен сначала разложить все новые книги по существующим папкам авторов, а потом задать новое сканирование этих же папок. Или я чего-то не понимаю и не использую возможности программы. Но проблема отбора дубликатов (хотя бы по МД5) остается очень актуальной. Эти дубликаты нужно не только убрать из базы, но и физически удалить с диска. А для этого список исключений просто незаменим.
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
drserj | Дата: Среда, 12.04.2017, 19:41 | Сообщение # 69 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Вот именно по этому и хочется еще раз воззвать к разуму пользователя: если пользуешься программой - какая для тебя разница, как программа хранит данные? %Z - и все вышеуказанные проблемы просто исчезают. А если ты пользуешься файловой системой для поиска книги - на кой тебе программа ??? Как в том старом анекдоте - тебе шашечки или ехать? Лично у меня сейчас весь контент - в формате %Z. Этот формат я могу в любой момент превратить в любой другой. Зачем мне что-то другое? Я не пытаюсь уговаривать, я пытаюсь понять, зачем на компьютере хранить книги в столь неудобном для самого компьютера формате? "Мыши плакали, кололись, но жрали кактус", "стоя и в гамаке" - только такие ассоциации Я мог бы насильно (как это делает большинство программ) навязывать свой формат, и 99% пользователям это абсолютно по... , но даже для 1% я хочу понять, ЗАЧЕМ??? Ведь даже если что-то случится с базой - в архивах можно сохранять реальные имена.
drSerj
|
|
| |
PFN | Дата: Среда, 12.04.2017, 20:30 | Сообщение # 70 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) Вот именно по этому и хочется еще раз воззвать к разуму пользователя: если пользуешься программой - какая для тебя разница, как программа хранит данные? %Z - и все вышеуказанные проблемы просто исчезают. Я вот прямо сейчас попытался использовать формат %Z и... ничего у меня не получилось для локальной библиотеки. Как насчет пошаговой инструкции?
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
drserj | Дата: Среда, 12.04.2017, 20:37 | Сообщение # 71 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Как насчет пошаговой инструкции? ммм... Ща...
1. Делаем поиск всех книг (не, ну можно и кусками, но если одним махом отмучаться - проще) 2. Выбираем все книги 3. Правой кнопкой - отправить на устройство, указываем в форме выходной каталог и маску файла %z 4. Для проверки в настройках библиотеки изменяем путь к локальной коллекции и формат 5. Если всё устраивает - давим оригиналы и при необходимости переносим архив в требуемый каталог.
Если что, я каждый день выполняю эту операцию для каждой новой порции книг скачанных с флибусты в тысячниках. Всё просто и быстро
drSerj
|
|
| |
1_абрам | Дата: Четверг, 13.04.2017, 10:44 | Сообщение # 72 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Цитата drserj ( ) Если что, я каждый день выполняю эту операцию для каждой новой порции книг скачанных с флибусты в тысячниках. Всё просто и быстро
Имхо, это удобнее делать рах в 2-3 месяца, используя тысячные архив с торентов.
|
|
| |
drserj | Дата: Четверг, 13.04.2017, 10:48 | Сообщение # 73 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата 1_абрам ( ) Имхо, это удобнее делать рах в 2-3 месяца, используя тысячные архив с торентов.
не... ждать месяц... зачем? Да и предпочитаю оригинальные архивы от флибусты, я гурман...
drSerj
|
|
| |
1_абрам | Дата: Четверг, 13.04.2017, 13:26 | Сообщение # 74 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Цитата drserj ( ) не... ждать месяц... зачем?
Так интересные книжки скачиваются сразу, но не из архивов, а непосредственно с флибусты. Пока это возможно, к счастью. Ну а захомячивание остального (в ожидании часа Х) удобно делать пореже. А архивы в торрентах вроде бы собираются из оригинальные архивы от флибусты.
|
|
| |
drserj | Дата: Четверг, 13.04.2017, 13:30 | Сообщение # 75 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата 1_абрам ( ) Так интересные книжки скачиваются сразу, но не из архивов а какая мне лично разница скачивать архивы каждый день или раз в месяц? Я всё качаю. По одной книге - нет смысла, да и не все книги качаются по одной, те которые заблокированы - только из архивов можно забрать.
drSerj
|
|
| |
|