WinFuture-Forum.de: Software zur Verwaltung von Magazin-Sammlung gesucht - WinFuture-Forum.de

Zum Inhalt wechseln

Nachrichten zum Thema: Software
Seite 1 von 1

Software zur Verwaltung von Magazin-Sammlung gesucht

#1 Mitglied ist offline   Spaghetticode 

  • Gruppe: aktive Mitglieder
  • Beiträge: 22
  • Beigetreten: 16. Januar 15
  • Reputation: 10

geschrieben 16. April 2017 - 21:15

Hallo Forum!

Ich würde gern meine GEO-Sammlung katalogisieren, finde aber irgendwie keine zufriedenstellende Lösung. Eine eigene Datenbank wäre eine Möglichkeit, aber ich habe doch immer noch die Hoffnung, dass es was 'fertiges' gibt.

Die Idee ist folgende:

GEO ist ja eine multithematische Zeitschrift mit Artikeln aus so gut wie allen Wissenschaftsgebieten. Ich würde gern ein Verzeichnis führen, in dem ich folgendes erfasse:

- Titel des Artikels
- Themenschwerpunkt des Artikels
- Kategorie ("Biologie", "Geografie", "Geschichte", etc.)
- kurze Inhaltszusammenfassung
- GEO-Ausgabe
- Seitennummer

Das Archiv soll dann natürlich auch durchsuchbar sein.

Hat da jemand einen guten Tipp?
0

Anzeige

#2 Mitglied ist offline   RalphS 

  • Gruppe: VIP Mitglieder
  • Beiträge: 7.992
  • Beigetreten: 20. Juli 07
  • Reputation: 885

geschrieben 16. April 2017 - 22:59

Die wichtigste Frage ist erstmal: gibt es eine strukturierte Übersicht über die Information, die Du brauchst, die in irgendeiner Form eingelesen und in eine Datenbank eingetragen werden kann? Und seien es nur die jeweiligen Inhaltsverzeichnisse (wobei das noch doof genug ist bei ausreichend vielen Ausgaben).

Händisch führt das nämlich zu nichts. Dann hättest Du eine durchsuchbare Datenbank... ohne Daten. Nicht sehr zielführend.


Wenn Dir SQL nicht völlig fremd ist und irgendeine Form von Frontend-Programmierung auch nicht (zB via PHP als lokale Website, zu bedienen über den Browser) wäre das der unproblematischste Ansatz.

Ansonsten, ... wüßte ich spontan nicht. Calibre eignet sich aber gut für die Verwaltung von Texten (als Buch oder auch als Zeitschrift). Vielleicht läßt sich damit was anfangen - besonders, da hier eigene Spalten definiert werden können, zB eben als Seitenzahl oder als Artikelkategorie. Das "Einfügeproblem" bleibt aber bestehen und calibre kann zwar importieren, möchte dazu aber Dokumente haben; einfach 'aus Liste importieren' geht meines Wissens nicht.
"If you give a man a fish he is hungry again in an hour. If you teach him to catch a fish you do him a good turn."-- Anne Isabella Thackeray Ritchie

Eingefügtes Bild
Eingefügtes Bild
0

#3 Mitglied ist offline   KingGozza 

  • Gruppe: aktive Mitglieder
  • Beiträge: 246
  • Beigetreten: 27. Januar 15
  • Reputation: 59

geschrieben 17. April 2017 - 10:00

Hatte mich gerade mal auf die Suche begeben aber nichts gefunden, was deinen Ansprüchen entgegenkommt.

Ich würde dir raten, etwas selbst zu bauen.
SQLite Datenbank, bastelst dir ein Frontend dazu (gibt ja einige Programmiersprachen) und um bilder zu lesen, kannst du Capture2Text (http://capture2text.sourceforge.net/) verwenden. Capture2Text hat auch eine CMD Variante, kannst es also dann auch direkt aus deinem Frontend ansprechen.

Wenn du Hilfe brauchst und es nicht allzu dringend ist, kann ich mal schauen was ich dahin gebastelt bekomme.
Meine Software

SpyderCPU - WeatherCast - InetCalculator v2 - YACPv² - HideMyFiles
Feedback und konstruktive Kritik, nehme ich gern entgegen
(bitte im jeweiligen Thread schreiben)
0

#4 Mitglied ist offline   RalphS 

  • Gruppe: VIP Mitglieder
  • Beiträge: 7.992
  • Beigetreten: 20. Juli 07
  • Reputation: 885

geschrieben 17. April 2017 - 10:31

Strukturell könnt man sowas machen:

Tabelle: Artikel
 - ArtikelID PK
 - AusgabeID FK(Ausgabe)
 - Titel des Artikels
 - Evtl Autor des Artikels als AutorID plus zusätzlicher Tabelle für die Autoren; gibt's auch mal mehr als einen Autoren pro Artikel, müßte NOCH eine Tabelle her, die jede ArtikelID mit allen zugehörigen AutorIDs verknüpft) 
 - Themenschwerpunkt des Artikels
 - kurze Inhaltszusammenfassung (=> Abstract)
 - Seitennummer
 - ggf weitere Artikel-spezifische Informationen

Tabelle: ArtikelKategorien
 - KategorieID FK(Kategorie) |PK
 - ArtikelID FK(Artikel)     |PK
 
Tabelle: Kategorie
 - KategorieID PK
 - Name 
 - Ggf kurze Beschreibung zu einzelnen Kategorien

Tabelle: Ausgabe
 - AusgabeID PK (zB als Herausgabedatum)
 - weitere Ausgabe-spezifische Informationen



Ist also strukturell sehr überschaulich. Weitere Dimensionen müßten natürlich in eigene Tabellen, zB für Artikelserien oder andere, im bisherigen Schema noch nicht erfaßte 'Kategorisierungen'.

Bilder auslesen würd ich dringendst von abraten - Fehler sind vorprogrammiert und die findet man dann auch nie wieder. "Optimal" wäre eine mehr oder weniger offiziell bereitgestellte Liste von Artikeln oder zumindest "irgendeine" Liste wie zB eine Liste von Ausgaben. Dann muß man nur noch einen sinnvollen Primärschlüssel zuweisen - zB über das Ausgabedatum unter der Annahme, daß nicht zwei Zeitschriften am selben Tag herauskommen (können) oder, wenn das nicht geht, mit Hilfe der Ausgabenummer. Die müßte dann ggf als Textfeld gespeichert werden, jedenfalls dann, wenn es auch 'nummernlose' Ausgaben gibt als Sonder- oder sonstige Bonusausgaben.

Der PK sollte aber sprechend sein wie eben bspw 20170101, damit man die Ausgaben auch schnell finden kann. Zeitschrift #3.1415926 findet man sicher auch in seiner DB; aber welche das sein soll, das erschließt sich dann erst durch Anschauen des Datensatzes selber. Nicht so toll, wenn man außerdem noch irgendwie Artikel oä. zuordnen will.
"If you give a man a fish he is hungry again in an hour. If you teach him to catch a fish you do him a good turn."-- Anne Isabella Thackeray Ritchie

Eingefügtes Bild
Eingefügtes Bild
0

#5 Mitglied ist offline   KingGozza 

  • Gruppe: aktive Mitglieder
  • Beiträge: 246
  • Beigetreten: 27. Januar 15
  • Reputation: 59

geschrieben 17. April 2017 - 10:40

"Der PK sollte aber sprechend sein wie eben bspw 20170101, damit man die Ausgaben auch schnell finden kann. Zeitschrift #3.1415926 findet man sicher auch in seiner DB; aber welche das sein soll, das erschließt sich dann erst durch Anschauen des Datensatzes selber. Nicht so toll, wenn man außerdem noch irgendwie Artikel oä. zuordnen will. "

Ich hätte das zusätzlich mit einer Volltextsuche versehen, somit kann man auch schnell nach Inhalten suchen, wie z.B. Namen.
Meine Software

SpyderCPU - WeatherCast - InetCalculator v2 - YACPv² - HideMyFiles
Feedback und konstruktive Kritik, nehme ich gern entgegen
(bitte im jeweiligen Thread schreiben)
0

#6 Mitglied ist offline   RalphS 

  • Gruppe: VIP Mitglieder
  • Beiträge: 7.992
  • Beigetreten: 20. Juli 07
  • Reputation: 885

geschrieben 17. April 2017 - 12:48

Indices kommen hinterher, einschließlich FT falls gewünscht.

Wo keine Daten sind, da kann auch nix indiziert werden. Wenn aber die Artikel einzeln eingetragen werden müssen, oder sonst irgendwie ohne eine existierende Verknüpfung an die einzelnen Ausgaben angehängt werden müssen, dann ist es toll, wenn man da mehr oder weniger aus dem Finger den richtigen Ausgabenschlüssel dranhängen kann.

Wenn ich also Heft 1/2017 in der Hand hab, dann kann ich mir a) da draus den Schlüssel 201701 aus der Hand schütteln (Monatsausgaben angenommen). Oder ich muß b) fünfmal gucken, welche auto-generierte ID mir das Datenbanksystem dieser Ausgabe zugewiesen hat, was ich mir beim fünfundzwanzigsten Artikel vielleicht gemerkt hab, welches bloß dummerweise der drittletzte war und mir das jetzt überhaupt nix mehr nützt.

"Hinterher", wenn die Daten also alle drin sind, dann ist die Beschaffenheit von PKs relativ egal.
"If you give a man a fish he is hungry again in an hour. If you teach him to catch a fish you do him a good turn."-- Anne Isabella Thackeray Ritchie

Eingefügtes Bild
Eingefügtes Bild
0

#7 Mitglied ist offline   Holger_N 

  • Gruppe: aktive Mitglieder
  • Beiträge: 4.300
  • Beigetreten: 11. September 10
  • Reputation: 222

geschrieben 17. April 2017 - 13:49

Dann erfasst man das erste Heft und das zweite bis zur Hälfte, quält sich, wenigstens das noch zu Ende zu machen, ab dem Dritten sortiert man nur noch die ganz wenigen wichtigen Artikel aus, die dann von Heft zu Heft immer weniger werden und ab Heft 12 liegt das Projekt acht Jahre brach.

Man müßte vorher unterscheiden, ob es vor Allem darauf ankommt, das Projekt möglichst gut umzusetzen oder ob das Ziel ist, am Ende einfach per Stichwortsuche nachgucken zu können, wo sich welcher Artikel befindet und bei letzterem Anwendungsfall, wie oft das pro Woche oder pro Monat vorkommt. Wenn man nur achtmal im Jahr einen bestimmten Artikel sucht, würde ich nur der Reihe nach alle Inhaltsverzeichnisse einscannen, in eine PDF, Texterkennung drüberlaufen lassen, fertig. Wenn es schick sein soll oder man auf der Inhaltsseite die Ausgabe nicht erkennt, die Titelseite mit dazu.
Ich bin ein sehr ordentlicher, fleißiger und reinlicher Mensch, nur leider gefangen im Körper eines schmuddeligen Faulpelzes … tja, kann man nix machen …
0

#8 Mitglied ist offline   RalphS 

  • Gruppe: VIP Mitglieder
  • Beiträge: 7.992
  • Beigetreten: 20. Juli 07
  • Reputation: 885

geschrieben 17. April 2017 - 18:59

Ganz richtig. Deswegen auch der eingehende Hinweis, daß die ganze Chose dann und nur dann angegangen werden sollte, wenn es bereits irgendein 'digitalisiertes' Verzeichnis geben sollte, welches für die Bedürfnisse so vollständig wie möglich sein sollte.

WIE dieses Verzeichnis vorliegt, ist erstmal nebensächlich, solange es nur strukturiert ist und zumindest per copy+paste übernommen (oder gleich per Script oä. eingelesen) werden kann.

Gibt's aber keine Basisdaten, dann hat man wie erwähnt am Ende die strukturierte Datenbank ohne die Daten da drin. Natürlich könnte man sich quick+dirty eine kleine PHP-Seite basteln, wo nur ein Formular drauf ist, wo man dann die Daten eingibt und diese dann in der Datenbank landen; aber wie Du schon richtig sagst, macht man das maximal ein paar Ausgaben mit und hat dann sehr schnell die Schnauze voll davon.

Ebooks oder etwas in anderem auswertbaren digitalen Dokumentformat könnte helfen.

Simple Scans von den einzelnen Inhaltsverzeichnissn der Ausgaben auch, aber die sind dann natürlich nicht durchsuchbar.
"If you give a man a fish he is hungry again in an hour. If you teach him to catch a fish you do him a good turn."-- Anne Isabella Thackeray Ritchie

Eingefügtes Bild
Eingefügtes Bild
0

#9 Mitglied ist offline   Holger_N 

  • Gruppe: aktive Mitglieder
  • Beiträge: 4.300
  • Beigetreten: 11. September 10
  • Reputation: 222

geschrieben 18. April 2017 - 09:53

Ich hatte das mit unseren Lieferscheinen in der Firma so ähnlich praktiziert. Alle eingescannt, die im Acrobat vorhandene Texterkennung drüberlaufen lassen (die rückt auch Dokumente gleich gerade) und dann die Lieferscheinnummer rauskopiert und als Zuordnug in der Auftragssoftware zum dazugehörigen Auftrag reinkopiert. Das war nicht viel Aufwand und am Ende hat man sogar noch Zeit gespart, wenn man sich nicht analog durch den Aktenordner wühlen muß.
Ich bin ein sehr ordentlicher, fleißiger und reinlicher Mensch, nur leider gefangen im Körper eines schmuddeligen Faulpelzes … tja, kann man nix machen …
0

#10 Mitglied ist offline   RalphS 

  • Gruppe: VIP Mitglieder
  • Beiträge: 7.992
  • Beigetreten: 20. Juli 07
  • Reputation: 885

geschrieben 18. April 2017 - 23:30

Hat halt nur den Haken, daß OCR oft Fehler einbaut, die man nicht notwendigerweise merkt. Dann wird aus 0 schon mal O oder 8.

Je nachdem, worum es geht, kann man das so machen. Besonders, wenn man keine Alternativen hat. Aber man muß sich über die Risiken im Klaren sein. Insbesondere hat man gar nix davon, wenn man fünf Min einscannt und dann fünf Std nachbearbeiten muß, weil Schlüsselinformationen nicht ausgelesen werden können oder fehlerhaft sind und nun 30 Ausgaben alle vom 1.1.1111 stammen.
"If you give a man a fish he is hungry again in an hour. If you teach him to catch a fish you do him a good turn."-- Anne Isabella Thackeray Ritchie

Eingefügtes Bild
Eingefügtes Bild
0

Thema verteilen:


Seite 1 von 1

1 Besucher lesen dieses Thema
Mitglieder: 0, Gäste: 1, unsichtbare Mitglieder: 0