Commit 3549f623 authored by Thomas Perret's avatar Thomas Perret

Add tesseract tests

parent 7b16fa8c
......@@ -103,10 +103,9 @@ class CharBoxBuilder(builders.BaseBuilder):
The file_descriptor must support UTF-8 ! (see module 'codecs')
"""
for box in boxes:
file_descriptor.write(box.get_unicode_string() + " 0\n")
file_descriptor.write(str(box) + " 0\n")
@staticmethod
def __str__():
def __str__(self):
return "Character boxes"
......@@ -114,13 +113,13 @@ def _set_environment():
global g_subprocess_startup_info
global g_creation_flags
if os.name == "nt":
if os.name == "nt": # pragma: no cover
g_subprocess_startup_info = subprocess.STARTUPINFO()
g_subprocess_startup_info.wShowWindow = subprocess.SW_HIDE
g_subprocess_startup_info.dwFlags |= subprocess.STARTF_USESHOWWINDOW
g_creation_flags = 0x08000000 # CREATE_NO_WINDOW
if getattr(sys, 'frozen', False):
if getattr(sys, 'frozen', False): # pragma: no cover
# Pyinstaller support
path = os.environ["PATH"]
if sys._MEIPASS in path:
......@@ -241,6 +240,7 @@ def get_available_builders():
builders.WordBoxBuilder,
CharBoxBuilder,
builders.DigitBuilder,
builders.DigitLineBoxBuilder,
]
......@@ -298,11 +298,11 @@ def cleanup(filename):
''' Tries to remove the given filename. Ignores non-existent files '''
try:
os.remove(filename)
except OSError:
except OSError: # pragma: no cover
pass
class ReOpenableTempfile(object):
class ReOpenableTempfile(object): # pragma: no cover
"""
On Windows, `tempfile.NamedTemporaryFile` occur Permission denied Error
when file is still open.
......@@ -457,12 +457,13 @@ def get_version():
upd = 0
if len(els) >= 3:
upd = els[2]
return (major, minor, upd)
version = (major, minor, upd)
if version == (0, 0, 0):
raise TesseractError(
ret, ("Unable to parse Tesseract version (not a number): [%s]"
% (ver_string)))
return version
except IndexError:
raise TesseractError(
ret, ("Unable to parse Tesseract version (spliting failed): [%s]"
% (ver_string)))
except ValueError:
raise TesseractError(
ret, ("Unable to parse Tesseract version (not a number): [%s]"
% (ver_string)))
T 105 705 130 734 0
h 136 704 155 734 0
e 161 703 178 725 0
( 205 696 216 732 0
q 222 694 241 725 0
u 247 702 266 723 0
i 273 703 281 733 0
c 288 701 305 724 0
k 310 702 329 732 0
) 335 695 347 730 0
[ 376 693 386 731 0
b 391 700 411 731 0
r 416 701 431 722 0
o 434 699 454 722 0
w 459 699 487 721 0
n 493 699 513 721 0
] 518 691 528 729 0
{ 559 691 572 728 0
f 580 698 598 729 0
o 597 697 617 720 0
x 622 698 642 718 0
} 650 690 663 727 0
j 687 688 700 727 0
u 706 695 727 717 0
m 732 696 764 718 0
p 768 687 789 717 0
s 794 694 809 717 0
! 817 694 823 726 0
O 104 654 133 685 0
v 137 654 157 675 0
e 162 653 179 675 0
r 185 654 199 675 0
t 224 652 235 679 0
h 241 653 261 683 0
e 266 652 283 674 0
$ 310 649 328 683 0
4 334 652 353 681 0
3 360 651 376 681 0
, 385 645 392 655 0
4 399 651 418 680 0
5 425 650 442 680 0
6 449 650 468 679 0
. 476 649 481 654 0
7 490 650 508 679 0
8 515 649 533 679 0
< 561 653 583 674 0
l 589 648 598 679 0
a 604 647 622 670 0
z 627 647 645 668 0
y 649 638 668 668 0
> 673 652 696 673 0
# 722 646 742 677 0
9 748 646 766 676 0
0 772 646 791 675 0
d 818 644 838 675 0
o 843 644 862 666 0
g 867 635 887 666 0
& 103 604 134 635 0
d 160 603 180 634 0
u 186 603 205 624 0
c 210 602 227 625 0
k 232 603 252 633 0
/ 257 602 269 633 0
g 273 594 293 624 0
o 298 601 318 624 0
o 322 601 342 623 0
s 347 601 361 623 0
e 366 600 383 623 0
, 389 595 396 605 0
a 424 599 442 622 0
s 448 599 463 622 0
1 493 599 504 629 0
2 514 599 532 629 0
. 540 598 545 603 0
5 554 599 572 628 0
% 578 597 614 629 0
o 638 596 658 619 0
f 662 597 680 628 0
E 700 596 725 626 0
- 731 604 744 610 0
m 749 595 781 618 0
a 785 594 803 617 0
i 809 595 819 626 0
l 825 595 835 626 0
f 103 555 120 585 0
r 121 555 135 576 0
o 138 553 158 576 0
m 164 554 194 575 0
a 220 552 238 575 0
s 244 552 259 574 0
p 263 544 284 574 0
a 288 551 306 574 0
m 312 552 344 573 0
m 349 551 381 573 0
e 385 550 403 572 0
r 408 551 423 572 0
@ 427 540 464 581 0
w 469 549 498 570 0
e 502 548 520 571 0
b 524 548 544 579 0
s 549 548 564 570 0
i 569 548 579 579 0
t 585 547 596 574 0
e 600 547 618 570 0
. 625 547 630 552 0
c 637 546 655 569 0
o 659 546 679 569 0
m 684 546 716 568 0
i 742 546 752 577 0
s 758 545 773 567 0
s 799 544 814 567 0
p 818 536 839 567 0
a 843 543 862 566 0
m 867 544 899 566 0
. 905 543 911 548 0
D 102 505 130 534 0
e 136 503 153 526 0
r 159 504 173 525 0
, 198 498 205 508 0
, 207 498 214 508 0
s 221 502 235 525 0
c 240 502 257 524 0
h 263 502 283 533 0
n 289 502 309 524 0
e 314 501 331 523 0
l 337 502 346 532 0
l 353 501 362 532 0
e 368 500 385 523 0
” 390 521 406 531 0
b 433 499 453 531 0
r 459 500 473 521 0
a 477 499 495 521 0
u 500 498 520 520 0
n 526 499 546 521 0
e 551 498 568 520 0
F 594 498 617 528 0
u 621 497 641 518 0
c 646 496 663 519 0
h 669 497 689 527 0
s 694 496 709 518 0
s 735 495 750 518 0
p 754 487 775 517 0
r 780 495 795 517 0
i 799 495 809 526 0
n 815 495 836 517 0
g 840 486 861 516 0
t 866 493 877 520 0
fi 102 454 121 482 0
b 126 454 145 485 0
e 150 453 167 476 0
r 173 454 187 475 0
d 212 452 232 483 0
e 237 452 254 474 0
n 260 453 280 474 0
f 306 452 323 482 0
a 323 451 341 473 0
u 346 451 366 472 0
l 372 451 381 481 0
e 387 450 404 472 0
n 410 450 430 472 0
H 456 450 485 480 0
u 489 449 509 470 0
n 515 449 536 471 0
d 540 448 560 479 0
. 567 448 572 453 0
L 601 448 625 478 0
e 630 446 648 469 0
r 674 447 689 469 0
e 692 446 710 468 0
n 715 446 736 468 0
a 740 445 759 468 0
r 764 446 779 467 0
d 782 444 803 476 0
b 827 444 848 475 0
r 853 444 868 466 0
u 871 443 892 465 0
n 897 444 918 466 0
< 101 406 110 425 0
< 110 406 119 425 0
r 127 404 141 426 0
a 144 403 162 426 0
p 167 395 188 425 0
i 194 403 202 434 0
d 208 402 228 433 0
e 233 402 251 424 0
) 256 404 265 423 0
) 265 404 274 423 0
s 302 401 317 424 0
a 321 401 339 423 0
u 345 400 364 422 0
t 370 400 380 427 0
e 385 400 403 422 0
p 428 391 449 422 0
a 453 399 471 422 0
r 477 400 492 421 0
- 496 407 509 413 0
d 513 398 534 429 0
e 538 398 556 420 0
s 561 397 576 420 0
s 581 397 596 420 0
u 600 397 621 419 0
s 626 396 641 419 0
l 667 397 677 428 0
e 682 396 700 419 0
c 725 395 743 418 0
h 748 396 769 426 0
i 774 395 784 426 0
e 789 394 807 417 0
n 812 395 833 417 0
p 100 346 120 376 0
a 125 354 143 376 0
r 149 354 163 375 0
e 167 353 184 375 0
s 190 353 204 375 0
s 210 352 224 375 0
e 229 352 246 374 0
u 251 352 271 373 0
x 276 352 296 373 0
. 303 351 308 356 0
L 337 351 361 381 0
a 366 350 384 373 0
v 409 350 429 371 0
o 434 349 453 372 0
l 459 350 468 380 0
p 473 341 494 371 0
e 499 348 516 371 0
m 543 348 574 370 0
a 579 347 597 370 0
r 602 348 617 369 0
r 621 347 636 369 0
o 639 346 659 369 0
n 664 347 685 369 0
e 690 345 707 368 0
r 733 346 748 368 0
a 751 345 770 368 0
p 774 336 795 367 0
i 800 345 810 376 0
d 815 344 837 375 0
a 840 343 859 366 0
s 100 304 114 326 0
a 119 304 137 326 0
l 143 304 152 334 0
t 159 303 169 330 0
a 174 303 192 325 0
s 219 302 233 325 0
o 238 302 257 324 0
p 262 293 282 324 0
r 288 302 302 323 0
a 306 301 324 323 0
i 351 301 360 332 0
] 367 301 376 332 0
c 403 300 420 322 0
a 425 299 443 322 0
n 449 300 469 322 0
e 474 299 491 321 0
p 517 290 538 321 0
i 543 299 553 329 0
g 558 289 579 320 0
r 584 298 599 320 0
o 602 297 622 320 0
. 628 297 633 302 0
E 662 297 687 327 0
l 693 296 703 327 0
z 729 296 748 317 0
o 752 295 772 318 0
r 776 295 792 317 0
r 795 295 811 317 0
o 814 294 834 317 0
m 99 254 130 276 0
a 135 253 153 276 0
r 159 254 174 275 0
r 178 254 193 275 0
é 196 252 216 284 0
n 221 253 242 274 0
r 268 252 283 274 0
é 286 251 304 283 0
p 309 243 330 273 0
i 335 251 345 282 0
d 350 250 371 281 0
o 375 250 395 273 0
s 421 249 436 272 0
a 440 249 459 272 0
l 464 250 474 280 0
t 479 249 490 276 0
a 495 248 513 271 0
s 540 248 555 270 0
o 559 247 579 270 0
b 582 247 603 279 0
r 608 248 623 269 0
e 626 246 644 269 0
e 669 246 687 269 0
l 692 246 702 277 0
p 728 237 749 268 0
e 753 245 771 267 0
r 776 245 791 267 0
r 795 245 810 267 0
o 813 244 833 267 0
p 98 196 118 226 0
e 123 203 140 226 0
r 146 204 160 225 0
e 164 203 181 225 0
z 186 203 204 224 0
o 209 202 228 225 0
s 233 202 248 224 0
o 253 202 272 224 0
. 279 202 284 207 0
A 313 202 342 232 0
r 369 201 383 222 0
a 387 200 405 222 0
p 409 191 430 222 0
o 435 199 454 222 0
s 459 199 474 221 0
a 478 198 497 221 0
m 523 199 555 221 0
a 560 197 578 220 0
r 583 198 598 220 0
r 602 198 617 219 0
o 621 196 640 219 0
m 645 197 677 219 0
r 703 196 718 218 0
é 721 195 740 227 0
p 744 187 765 218 0
i 770 195 780 226 0
d 785 194 806 226 0
a 810 194 829 217 0
s 98 154 112 176 0
a 117 154 135 176 0
l 141 154 150 184 0
t 157 153 167 180 0
a 172 153 190 175 0
s 217 152 231 175 0
o 236 152 255 174 0
b 259 152 279 183 0
r 285 152 299 174 0
e 303 151 320 173 0
0 346 150 366 173 0
C 391 150 408 172 0
5 413 149 431 179 0
0 436 149 456 172 0
p 481 140 502 171 0
r 507 149 522 171 0
e 525 148 543 171 0
g 547 139 568 170 0
u 572 147 593 169 0
i 598 148 608 179 0
e 613 140 631 169 0
o 635 146 655 169 0
s 660 146 675 169 0
o 679 146 699 169 0
. 705 146 710 151 0
T 105 705 130 734 0
h 136 704 155 734 0
e 161 703 178 725 0
( 205 696 216 732 0
q 222 694 241 725 0
u 247 702 266 723 0
i 273 703 281 733 0
c 288 701 305 724 0
k 310 702 329 732 0
) 335 695 347 730 0
[ 376 693 386 731 0
b 391 700 411 731 0
r 416 701 431 722 0
o 434 699 454 722 0
w 459 699 487 721 0
n 493 699 513 721 0
] 518 691 528 729 0
{ 559 691 572 728 0
f 580 698 598 729 0
o 597 697 617 720 0
x 622 698 642 718 0
} 650 690 663 727 0
j 687 688 700 727 0
u 706 695 727 717 0
m 732 696 764 718 0
p 768 687 789 717 0
s 794 694 809 717 0
! 817 694 823 726 0
O 104 654 133 685 0
v 137 654 157 675 0
e 162 653 179 675 0
T 105 705 130 734 0
h 136 704 155 734 0
e 161 703 178 725 0
( 205 696 216 732 0
q 222 694 241 725 0
u 247 702 266 723 0
i 273 703 281 733 0
c 288 701 305 724 0
k 310 702 329 732 0
) 335 695 347 730 0
[ 376 693 386 731 0
b 391 700 411 731 0
r 416 701 431 722 0
o 434 699 454 722 0
w 459 699 487 721 0
n 493 699 513 721 0
] 518 691 528 729 0
{ 559 691 572 728 0
f 580 698 598 729 0
o 597 697 617 720 0
x 622 698 642 718 0
} 650 690 663 727 0
j 687 688 700 727 0
u 706 695 727 717 0
m 732 696 764 718 0
p 768 687 789 717 0
s 794 694 809 717 0
! 817 694 823 726 0
O 104 654 133 685 0
v 137 654 157 675 0
e 162 653 179 675 0
# 1 2 3 4
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<title></title>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
<meta name='ocr-system' content='tesseract 4.0.0' />
<meta name='ocr-capabilities' content='ocr_page ocr_carea ocr_par ocr_line ocrx_word ocrp_wconf'/>
</head>
<body>
<div class='ocr_page' id='page_1' title='image "input/specific/test-digits.png"; bbox 0 0 275 36; ppageno 0'>
<div class='ocr_carea' id='block_1_1' title="bbox 4 0 275 32">
<p class='ocr_par' id='par_1_1' lang='eng' title="bbox 4 0 275 32">
<span class='ocr_line' id='line_1_1' title="bbox 4 0 275 32; baseline 0 0; x_size 43.333332; x_descenders 10.833333; x_ascenders 10.833333">
<span class='ocrx_word' id='word_1_1' title='bbox 4 0 275 32; x_wconf 68'>3355456544</span>
</span>
</p>
</div>
</div>
</body>
</html>
This diff is collapsed.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment