coco-textに対して40分の1くらいの画像数ですが、curved textのground truthを含むTotal-Text-Dataset。
アノテーションデータは、ここからダウンロード出来ます。 また、画像はこちらからダウンロード出来ます。
アノテーションはmatファイルで、下記のフォーマットで提供されています。
- Column 1-2 = X-coordinate
- Column 3-4 = Y-coordinate
- Column 5 = Text
- Column 6 = Orientation (c=curve; h=horizontal; m=multi-oriented; #=dont care)
画像に表示して確認してみました。下記のコードをipythonなどで実行すれば、別の画像にも同じように出来るはずです。
In [1]: import cv2 In [2]: import scipy.io as sio In [3]: import numpy as np In [4]: data = sio.loadmat('gt_img13.mat') In [5]: img = cv2.imread('img13.jpg') In [6]: for i in range(data['gt'].shape[0]): ...: points = np.array([(x, y) for x, y in zip(data['gt'][i][1][0], data['gt'][i][3][0])], dtype=np.int32) ...: cv2.polylines(img, [points], isClosed=True, color=(0, 255, 0), thickness=3) ...: In [7]: cv2.imshow('TEST', img) In [8]: cv2.waitKey(0) In [9]: cv2.destroyAllWindows()