. Dans, nous présentons unéchantillon des différents exemples pour chaque logo de la base d'apprentissage que nous avons manuellement annoté

D. Doermann, The indexing and retrieval of document images : A survey, Computer Vision and Image Understanding, 1998.

O. Frieder-d.-grossman, G. Agam, S. Argamon, and D. Lewis, Content-based document image retrieval in complex document collections, Proc, 2007.

S. Marinai, S. Marinai, and H. Fujisawa, Machine Learning in Document Analysis and Recognition, 2008.

. Jp, O. Domenger, N. Augereau, and . Journet, Semi-structured document image matching and recognition, 2013.

D. Gaceb, Contributions au tri automatique de documents et de courrier d'entreprises, 2009.
URL : https://hal.archives-ouvertes.fr/hal-01462029

R. Jayadevan, S. R. Kolhe, P. M. Patil, and U. Pal, Automatic processing of handwritten bank cheque images : A survey, Int. J. Doc. Anal. Recognit, vol.15, issue.4, pp.267-296, 2012.

H. Hamza, Y. Belaid, A. Belaid, and B. B. Chaudhuri, Incremental classification of invoice documents, 2008 19th International Conference on Pattern Recognition, pp.1-4, 2008.
URL : https://hal.archives-ouvertes.fr/inria-00346942

E. Sorio, A. Bartoli, G. Davanzo, and E. Medvet, A domain knowledge-based approach for automatic correction of printed invoices, International Conference on Information Society, pp.151-155, 2012.

M. Diligenti, P. Frasconi, and M. Gori, Hidden tree markov models for document image classification, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.25, issue.4, pp.519-523, 2003.

B. Janssen, E. Saund, E. A. Bier, P. Wall, and M. A. Sprague, Re-ceipts2go : the big world of small documents, ACM Symposium on Document Engineering, 2012.

R. Szabo, A novel machine learning based approach for retrieving information from receipt images, 2014.

S. Garimella, Identification of receipts in a multi-receipt image using spectral clustering, International Journal of Computer Applications, vol.155, issue.2, 2016.

O. Ivan, Applying ocr technology for receipt recognition, 2016.

M. Jones and P. Viola, Rapid object detection using a boosted cascade of simple features, CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, 2001.

A. Suponenkovs, A. Sisojevs, G. Mos?ns, J. Kampars, K. Pinka et al., Application of image recognition and machine learning technologies for payment data processing, 5th IEEE Workshop on Advances in Information, Electronic and Electrical Engineering (AIEEE), 2017.

N. Otsu, A threshold selection method from grey scale histogram, IEEE Trans. on Syst. Man and Cyber, 1979.

E. Lecolinet and R. G. Casey, A survey of methods and strategies in character segmentation, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996.

Y. Lu, Machine printed character segmentation -; an overview, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995.

D. , L. R. Smith, and D. Antonova, Adapting the tesseract open source ocr engine for multilingual ocr, ACM International Workshop on Multilingual OCR, 2009.

, Ocr, pdf, text scanning software and solutions -abbyy

, Cloud vision api powerful image analysis

S. Delisle and I. Biskri, Les n-grams de caractères pour l'aideà l'extraction de connaissances dans des bdd textuelles multilingues, 2001.

R. , W. Soukoreff, and I. Mackenzie, Measuring errors in text entry tasks : An application of the levenshtein string distance statistic, pp.319-320, 2001.

Y. Loy-xiaoou-tang-pan-he and W. Huang, Reading scene text in deep convolutional sequences, 2015.

M. Jaderberg, A. Vedaldi, and Z. A. , Deep features for text spotting, 2014.

A. Vedaldi-andrew-zisserman, M. Jaderberg, and K. Simonyan, Reading text in the wild with convolutional neural networks, 2014.

Y. Li, S. Wang, Q. Tian, and X. Ding, Feature representation for statistical-learning-based object detection : A review, Pattern Recognition, vol.48, issue.11, pp.3542-3559, 2015.

N. Ayache and O. Faugeras, HYPER : a new approach for the recognition and positioning of 2D objects, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.8, issue.1, pp.44-54, 1986.
URL : https://hal.archives-ouvertes.fr/inria-00615534

G. Csurka, C. R. Dance, L. Fan, J. Willarnowski, and C. Baray, Visual categorization with bags of keypoints, 2004.

D. Rumelhart, G. E. Hinton, and R. J. Williams, Learning internal representations by error propagation, Explorations in the Microstructure of Cognition, 1986.

G. E. Hinton, A. Krizhevsky, and I. Sutskever, Imagenet classification with deep convolutional neural networks, NIPS, 2012.

V. Nair and G. E. Hinton, Evaluation of pooling operations in convolution architectures for object recognition, ICANN, 2010.

D. Scherer, A. Muller, and S. Behnke, Rectified linear units improve restricted boltzmann machines, International Conference on Machine Learning, 2010.

I. J. Goodfellow, D. Warde-farley, M. Mirza, A. Courville, and Y. Bengio, Maxout networks, 2013.

J. Deng, A. Berg, S. Satheesh, H. Su, A. Khosla et al., , 2012.

K. Simonyan and A. Zisserman, Very deep convolutional networks for large-scale image recognition, 2015.

Y. , J. P. Sermanet, . D. Reed, V. Anguelov-d.erhan, A. Vanhoucke et al., Going deeper with convolutions, 2014.

K. He, X. Zhang, S. Ren, and J. Sun, Deep residual learning for image recognition, 2016.

J. Yosinski, J. Clune, Y. Bengio, and H. Lipson, How transferable are features in deep neural networks, 2014.

J. Donahue, O. Jia, J. Vinyals, J. Hoffman, E. Zhang et al., Decaf :a deep convolutional activation feature for generic visual recognition, 2013.

P. Sermanet, D. Eigen, X. Zhang, M. Mathieu, R. Fergus et al., Overfeat : Integrated recognition, localization and detection using convolutional networks, International Conference on Learning Representation, 2014.

M. D. Zeiler and R. Fergus, Visualizing and understanding convolutional networks, 1311.

M. Oquab, L. Bottou, I. Laptev, and J. Sivic, Learning and transferring mid-level image representations using convolutional neural networks, 2013.
URL : https://hal.archives-ouvertes.fr/hal-00911179

X. Zhang, M. Mathieu, R. Fergus, and Y. Lecun, Overfeat : Integrated recognition, localization and detection using convolutionl networks, Proceedings of international Conference on Learning Representation (ICLR), 2014.

C. Szegedy, A. Toshev, D. Erhan, and G. Inc, Deep nueral networks for object detection, Advances in Neural Information Processing Systems (NIPS), 2014.

R. Girshick, J. Donahue, T. Darell, and J. Malik, Rich feature hierarchies for accurate object detection and semantic segmentation, 2014.

J. Uijlings, K. Van-de-sande, T. Gevers, and A. Smeulders, Selective search for object recognition, IJCV, 2013.

R. Girshic, Fast r-cnn, 2015.

J. Dai, Y. Li, K. He, and J. Sun, R-FCN : object detection via region-based fully convolutional networks, CoRR, 2016.

W. Liu, D. Anguelov, D. Erhan, C. Szegedy, S. E. Reed et al., SSD : single shot multibox detector, CoRR, 2015.

K. He, G. Gkioxari, P. Dollár, and R. B. Girshick, Mask R-CNN, 2017.

K. Shaoqing-ren, R. B. He, J. Girshick, and . Sun, Faster R-CNN : towards real-time object detection with region proposal networks, CoRR, 2015.

J. Shotton, A. Fitzgibbon, M. Cook, T. Sharp, M. Finocchio et al., Real-time human pose recognition in parts from single depth images, Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition, pp.1297-1304, 2011.

J. Long, E. Shelhamer, and T. Darrell, Fully convolutional networks for semantic segmentation, CoRR, 2014.

V. Badrinarayanan, A. Kendall, and R. Cipolla, Segnet : A deep convolutional encoder-decoder architecture for image segmentation, CoRR, 2015.

E. David and N. Netanyahu, Deeppainter : Painter classification using deep convolutional autoencoders, pp.20-28, 2016.

F. Yu and V. Koltun, Multi-scale context aggregation by dilated convolutions, CoRR, 2015.

L. Chen, G. Papandreou, I. Kokkinos, K. Murphy, and A. L. Yuille, Deeplab : Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs, CoRR, 2016.

A. Paszke, A. Chaurasia, S. Kim, and E. Culurciello, Enet : A deep neural network architecture for real-time semantic segmentation, CoRR, 2016.

S. Jégou, M. Drozdzal, D. Vázquez, A. Romero, and Y. Bengio, The one hundred layers tiramisu : Fully convolutional densenets for semantic segmentation, CoRR, 2016.

G. Huang, Z. Liu, and K. Q. Weinberger, Densely connected convolutional networks, CoRR, 2016.

O. Ronneberger, P. Fischer, and T. Brox, U-net : Convolutional networks for biomedical image segmentation, CoRR, 2015.

R. Collobert and J. Weston, A unified architecture for natural language processing : Deep neural networks with multitask learning, pp.160-167, 2008.

Z. Kuang, Z. Li, T. Zhao, and J. Fan, Deep multi-task learning for large-scale image classification, pp.310-317, 2017.

L. Deng, G. Hinton, and B. Kingsbury, New types of deep neural network learning for speech recognition and related applications : An overview, 2013.

S. Ruder, An overview of multi-task learning in deep neural networks, CoRR, 2017.

M. Long and J. Wang, Learning multiple tasks with deep relationship networks, CoRR, 2015.

A. Kendall, Y. Gal, and R. Cipolla, Multi-task learning using uncertainty to weigh losses for scene geometry and semantics, CoRR, 2017.

K. Hashimoto, C. Xiong, Y. Tsuruoka, and R. Socher, A joint many-task model : Growing a neural network for multiple NLP tasks, CoRR, 2016.

B. Mansencal, J. Benois-pineau, H. Bredin, A. Benoit, N. Voiron et al., IRIM at TRECVID 2016 : Instance Search, 2016.
URL : https://hal.archives-ouvertes.fr/hal-01416953

H. Su, X. Zhu, and S. Gong, Deep learning logo detection with data expansion by synthesising context, pp.530-539, 2017.

H. Su, S. Gong, and X. Zhu, Weblogo-2m : Scalable logo detection by deep learning from the web, 2017.

S. Bianco, M. Buzzelli, D. Mazzini, and R. Schettini, Deep learning for logo recognition, Neurocomputing, vol.245, pp.23-30, 2017.

A. Bagdanov, L. Ballan, M. Bertini, and A. D. Bimbo, Trademark matching and retrieval in sports video databases, Proceedings of the international workshop on Workshop on multimedia information retrieval, 2007.

S. Romberg and R. Lienhart, Bundle min-hashing for logo recognition, Proceedings of the 3rd ACM Conference on International Conference on multimedia retrieval, 2013.

S. Romberg, R. Lienhart, and R. Van-zwol, Scalable logo recognition in real-word images, Proceedings of the 1st ACM International Conference on multimedia retrieval, 2011.

R. Boia, C. Florea, L. Florea, and R. Dogaru, Logo localization and recognition in natural images using homographic class graphs, Machine Vision and Application, 2016.

R. Boia, C. Florea, and L. Florea, Elliptical asift agglomeration in class prototype for logo detection, BMVC, 2015.

C. Eggert, A. Winschel, and R. Lienhart, On the benefit of synthetic data for company logo detection, Proceedings of the 23rd ACM international conference on Multimedia, 2015.

S. Bianco, M. Buzzelli, D. Mazzini, and R. Schettini, Logo recognition using cnn features, International Conference on Image Analysis and Processing, pp.438-448, 2015.

F. N. Iandola, A. Shen, P. Gao, and K. Keutzer, Deeplogo : Hitting logo recognition with the deep neural network hammer, 2015.

G. Oliveira, X. Frazão, A. Pimentel, and B. Ribeiro, Automatic graphic logo detection via fast region-based convolutional networks, CoRR, 2016.

K. Chatfield, K. Simonyan, A. Vedaldi, and A. Zisserman, Return of the devil in the details : Delving deep into convolutional nets, 2014.

S. C. Hoi, X. Wu, H. Liu, Y. Wu, H. Wang et al., Logo-net : Largescale deep logo detection and brand recognition with deep region-based convolutional networks, 2015.

M. Anthimopoulos, B. Gatos, and P. , Detection of artificial and scene text in images and video frames, Pattern Anal Applic, 2013.

H. Chen, S. S. Tsai, G. Schroth, D. M. Chen, R. Grzeszczuk et al., Robust text detection in natural images with edge-enhanced maximally stable extremal regions, 2011.

X. Xu-cheng-yin, K. Yin, H. Huang, and . Hao, Robust text detection in natural scene images, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.36, issue.5, pp.970-983, 2014.

A. Mishra, K. Alahari, and C. V. Jawahar, Scene Text Recognition using Higher Order Language Priors, 2012.
URL : https://hal.archives-ouvertes.fr/hal-00818183

T. Novikova, O. Barinova, P. Kohli, and V. Lempitsky, Largelexicon attribute-consistent text recognition in natural images, ECCV, pp.752-765, 2012.

J. and M. L. Neumann, Scene text localization and recognition with oriented stroke detection, CVPR, 2013.

J. Jerod, Z. Wainman, D. Butler, J. Knoll, and . Feild, Toward integrated scene text reading, EEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2014.

A. Bissacco, M. Cummins, Y. Netzer, and H. Neven, Photoocr : Reading text in uncontrolled conditions, pp.785-792, 2013.

O. Alsharif and J. Pineau, End-to-end text recognition with hybrid hmm maxout models, CoRR, 2013.

D. and K. L. Gomez, Multi-script text extraction from natural scenes, Computer Vision Center IPC, 2013.

J. and M. L. Neumann, Real-time scene text localization and recognition, CVPR, 2013.

L. Neumann and J. Matas, Text localization in real-world images using efficiently pruned exhaustive search, pp.687-691, 2011.

K. Wang, B. Babenko, and S. Belongie, End-to-end scene text recognition, pp.1457-1464, 2011.

C. Gopalan and D. Manjula, Sliding window approach based text binarisation from complex textual images, IJCSE) International Journal on Computer Science and Engineering, 2010.

A. Nicolaou and B. Gatos, Handwritten text line segmentation by shredding text into its lines, pp.626-630, 2009.

V. Shapiro, G. Gluhchev, and V. Sgurev, Handwritten document image segmentation and analysis, Pattern Recognition Letters, vol.14, issue.1, pp.71-78, 1993.

X. Zhu, Y. Jiang, S. Yang, X. Wang, W. Li et al., Deep residual text detection network for scene text, CoRR, 2017.

F. Jiang, Z. Hao, and X. Liu, Deep scene text detection with connected component proposals, CoRR, 2017.

Z. Zhong, L. Jin, S. Zhang, and Z. Feng, Deeptext : A unified framework for text proposal generation and text detection in natural images, CoRR, 2016.

Z. Zhang, C. Zhang, W. Shen, C. Yao, W. Liu et al., Multi-oriented text detection with fully convolutional networks, CoRR, 2016.

M. Liao, B. Shi, X. Bai, X. Wang, and W. Liu, Textboxes : A fast text detector with a single deep neural network, CoRR, 2016.

B. Shi, X. Bai, and S. J. Belongie, Detecting oriented text in natural images by linking segments, CoRR, 2017.

T. Wang, D. J. Wu, A. Coates, and A. Y. Ng, End-to-end text recognition with convolutional neural networks, pp.3304-3308, 2012.

C. Yao, X. Bai, B. Shi, and W. Liu, Strokelets : A learned multi-scale representation for scene text recognition, pp.4042-4049, 2014.

O. Alsharif and J. Pineau, End-to-end text recognition with hybrid HMM maxout models, CoRR, 2013.

A. Bissacco, M. Cummins, Y. Netzer, and H. Neven, Photoocr : Reading text in uncontrolled conditions, pp.785-792, 2013.

T. Wang, D. J. Wu, A. Coates, and A. Y. Ng, End-to-end text recognition with convolutional neural networks, pp.3304-3308, 2012.

A. Mishra, K. Alahari, and C. V. Jawahar, Scene text recognition using higher order language priors, vol.09, p.2012
URL : https://hal.archives-ouvertes.fr/hal-00818183

T. Novikova, O. Barinova, P. Kohli, and V. Lempitsky, Largelexicon attribute-consistent text recognition in natural images, 2012.

V. Goel, A. Mishra, K. Alahari, and C. V. Jawahar, Whole is Greater than Sum of Parts : Recognizing Scene Text Words, 2013.
URL : https://hal.archives-ouvertes.fr/hal-01064766

M. Jaderberg, K. Simonyan, A. Vedaldi, and A. Zisserman, Reading text in the wild with convolutional neural networks, CoRR, 2014.

B. Moysset, C. Kermorvant, and C. Wolf, Full-page text recognition : Learning where to start and when to stop, CoRR, 2017.
URL : https://hal.archives-ouvertes.fr/hal-01563124

M. E. Roberts, B. M. Stewart, A. Storer-dustin-tingley, C. Lucas, and R. A. , Computer-assisted text analysis for comparative politics, Political Analysis, vol.23, issue.2, pp.254-277, 2015.

C. Richard, R. Wang-estevam, M. Hruschka-tom, A. Mitchell, J. Carlson et al., Coupled semi-supervised learning for information extraction, WSDM '10 Proceedings of the third ACM international conference on Web search and data mining, 2010.

C. Roche, Le terme et le concept : fondements d'une ontoterminologie, CoRR, 2008.
URL : https://hal.archives-ouvertes.fr/hal-00202645

D. Sorgel and N. Aussenac-gilles, Text analysis for ontology and terminology engineering, Applied Ontology, vol.1, issue.1, pp.35-46, 2005.

M. , F. Santos, F. Mota-pinto, and A. Marques, Ontology-supported database marketing, Journal of Database Marketing Customer Strategy Management, 2009.

W. J. Frawley, G. Piatetsky-shapiro, and C. J. Matheus, Knowledge discovery in databases : An overview, AI Mag, vol.13, issue.3, pp.57-70, 1992.

L. Di-jorio, L. Abrouk, C. Fiot, M. Teisseire, and D. Hérin, Enrichissement d'ontologie basé sur les motifs séquentiels, 2007.

H. Stuckenschmidt and G. Schuster, Building shared ontologies for terminology integration, Workshop on "Ontologies, 2001.

K. Kularbphettong, Enrichment ontology instance by using data mining techniques, pp.150-155, 2018.

C. Amato, S. Staab, A. G. Tettamanzi, T. D. Minh, and F. Gandon, Ontology enrichment by discovering multi-relational association rules from ontological knowledge bases, pp.333-338, 2016.
URL : https://hal.archives-ouvertes.fr/hal-01322947

T. Mikolov, I. Sutskever, K. Chen, G. S. Corrado, and J. Dean, Distributed representations of words and phrases and their compositionality, pp.3111-3119, 2013.

A. Frome, G. S. Corrado, J. Shlens, S. Bengio, J. Dean et al., Devise : A deep visual-semantic embedding model, pp.2121-2129, 2013.

J. Gao, X. He, Y. Wen-tau, and L. Deng, Learning semantic representations for the phrase translation model, CoRR, 2013.

X. Zhang and Y. Lecun, Text understanding from scratch, CoRR, 2015.

A. Benoit, P. Lambert, R. Raoui-outach, and C. Million-rousseau, Lecture automatique d'un ticket de caisse par vision embarquee sur un telephone mobile, RFIA, 2016.
URL : https://hal.archives-ouvertes.fr/hal-01319960

. Exemple-d'informationsà-extraire and . .. De-caisse, 11 (a). Incohérence sur le nombre d'articles présents dans le ticket de caisse. 11 (b). Incohérence sur le montant total du ticket de caisse, p.11

. Différence, . .. De-taille-moyenne, and . .. Tesseract, Exemple de mauvaise détection (en vert) sur une image dont la couleur du fond n'est pas assez contrastée par rapportà celle du ticket et où le fond n'est pas uni, IoU = 0,36, vol.16, p.33

R. Googlenet, , 2014.

, Exemple de bloc Résiduel

, Détection d'objetsà l'aide de la méthode CNN : images extraites de

. Différentesétapes-de-la-méthode-r-cnn, 48 3.6. Différentesétapes de la méthode FastR-CNN : images extraites de, vol.48, p.49

, Différence entre détection d'objets et segmentation sémantique

, Méthode de sur-échantillonnage (max-unpooling), image extraite de, vol.57

, Après un processus réalisé par les couches neuronales intermédiaires, ces positions sont ré-utilisées dans les couches de max-unpooling, vol.52

]. .. , De gaucheà droite : Layers : couche utilisée dans le modèle, Transition Down transition de sous-échantillonnage et Transition Down transition de sur-échantillonnage, image extraite de [61], vol.55

, Les deux différentes approches permettant de réaliser du multi-tâche avec des réseaux de neurones profonds : partage de paramètres en dur et partage de paramètres léger, Ces illustrations sont extraites de l'article

. .. , Acquisition d'images de ticket de caisse prise dans des conditions rendant la localisation de texte difficile, Détection et Reconnaissance de texte dans un document, vol.71, p.76

. .. , Échantillon d'images reçues en entrée du système

. .. , Un module d'Inception défini dans GoogLeNet [37], vol.84

, La transformation d'un réseau de classification en un réseau entièrement convolutionnel permet d'obtenir une carte de probabilité en sortie, interprétée comme une segmentation sémantique. Schéma s'appuyant sur l'architecture AlexNet

. .. , Fonctionnalité d'acquisition d'image de ticket de caisse sur l'application TachetKoa ? proposée par AboutGoods Company, vol.87

, Représentation de l'interface permettant l'annotation des tickets pour la détection des tickets et des logos

. .. , Visualisation de la déformation légère du ticket dans l'image lorsque celleci est redimensionnée en une taille carrée de 1219 x 1219, Évaluation de la taille des imagesà extraire permettant d'assurer la présence de suffisamment d'informations

. .. , En bleu est représenté le pourcentage calculé sur des images contenant un ticket, en rouge sur des images ne contenant pas de ticket, Graphique représentant le pourcentage de pixels positifs mesuré sur la carte de chaleur, lors de l'étape détection du ticket dans l'image sur unéchantillon de 1 500 images

, Quelques résultats de la localisation grossière des tickets de caisse grâcè a l'analyse de la carte de chaleur obtenue en sortie du réseau de segmentation sémantique. On ne constate aucune perte d'informations, mais une localisation imprécise, Les cas d'erreurs de l'approche analyse d'image et de l'approche analyse de texte concernant la détection de la présence d'un ticket dans l'image

, Algorithme de localisation fine du ticket, nommé bouclage DL progressif 103 4.21. Localisation du ticket en deuxétapes via la méthode Deep + Détecteur .105 4.22. Détection de l'enseigne, fusion de deux analyses différentes

. .. , Évolution de la valeur de la métrique IoU dans différentes configurations, en bleu clair la vérité terrain et en bleu foncé la détection faite par l'algorithme

, Illustration des images obtenues après annotation pour la segmentation sémantique. La première ligne montre les différentes boîtes englobantes définies manuellement, sur la deuxième ligne sont représentées les cartes de segmentation qui en résultent et qui servirontà l'apprentissage, p.122

, Diagramme d'un exemple d'architecture multi-tâche basée sur le réseau FC-DenseNet, avec ici deux tâches différentes

, Les deux différentes bases de données prises en compte pour la segmentation sémantique des blocs de texte. La première base aété pré-traitée (chapitre 4) alors que la deuxième base correspond aux images brutes, eventuellement redressées

, Matrice de confusion des quatre architecturesévaluées sur un problème de segmentationà 9 classes, En haut les deux architectures inspirées de FC-DenseNet et en bas les deux architectures inspirées de ENet, p.130

, Exemples de comparaison des cartes de segmentation obtenues avec le réseau mono-tâche (détection du ticket) et avec le réseau multi-tâche,à deux tâches, p.132

, Comparaison des cartes de segmentation pour le problèmeà 3 classes (Fond/Ticket/Texte) réalisées d'abord par le réseau mono-tâche et puis par la dernière sortie du réseau multitâche, Exemple de comparaison de la localisation du ticket réaliséeà partir des cartes de segmentation, avec le réseau mono-tâche (détection du ticket) et avec le réseau multi-tâcheà deux tâches (détection du ticket et localisation des bords du ticket)

. .. Construite, Les différentes classes de caractères difficilement différentiables hors contexte et considérées comme appartenantà une classe unique pour la classification.142 5.17. Architecture pour la classification des caractères proposée par jaderberg et al. [25]. Description de l'architecture implémentée sur Caffe, Échantillon de la base de caractères

, 28 2.2. Influence de l'inclinaison du texte sur la performance des différents OCRs sur le marché actuel

F. Architecture and . Papier, DB : Blocs Denses, TD : Transitions de sousechantillonnage, TU : Transitions de sur-échantillonnage , m : correspond au nombre total de cartes de caractéristiques (features map) et c correspond au nombre de classes

. .. Liste, 88 4.2. Précision de classification pour la reconnaissance de ticket dans une image pour les quatre architectures testées

, Précision de la classification et matrice de confusion pour la détection d'un ticket sur une image, selon deux méthodes différentes : méthode de classification directe par un réseau de neurones et une la méthode que nous avons proposée, basée sur de la segmentation sémantique par patch. Résultats obtenus sur une base de données de 1500 images, p.96

. .. Performance-de-la-détection-du-ticket, 99 4.5. Différentes dimensionsévaluées pour la localisation du ticket dans l'image pour la méthode bouclage DL progressif

, Précision de la classification pour la reconnaissance des logos dans une image de ticket de caisse pour les quatre architectures testées, p.108

). .. Exemple-de-la-terminologie-d'une-enseigne-;-auchan, Les performances de localisation de la méthode d'analyse d'image sur u? echantillon d'une dizaine d'image de ticket par enseigne, p.115

. .. , 127 5.2. Performances des différentes configurations des architectures ENet et FC-Densenet, sur un problème de segmentationà 8 classes, obtenues après 800 000 itérations, sur les images issues du pré-traitement, Différentes configurations des problèmes de segmentation, p.128

, Performances des différentes configurations des architectures ENet et FC-Densenet, sur un problème de segmentationà 9 classes, obtenues après 800 000 itérations, sur les images brutes, p.129

, Configuration du réseau multi-tâche pour la détection du ticket dans l'image131

, Résultats Mono-tâche et Multi-tâches sur problèmeà trois sorties redondantes. Tous les entraînements sont réalisés avec un BatchSize de 2 et un nombre d'epoch de 50, Résultats Mono-tâche et Multi-tâches sur problèmeà deux classes Fond/Ticket 132 5.6

, Tous les entraînements sont réalisés avec un BatchSize de 2 et un nombre d'epoch de 50, Résultats Multi-tâches sur problèmeà quatre sorties non redondantes

, Performances des différentes architectures des réseaux de neurones entraînées pour la classification des caractères des tickets de caisses avec les bases B1 (sensibleà la casse), B2 (insensibleà la casse) et B3 (sensiblè a la casse avec fusion des classes proches), Les différents caractères spéciaux rencontrés sur l'échantillon