Microsoft は、より良いユーザー エクスペリエンスを提供し、情報へのアクセシビリティを向上させるために、Windows 11 と Windows 10 の両方のフォト アプリケーションに OCR 機能を正式に導入しました。以前は、Windows ユーザーはこの機能を実行するためにサードパーティのアプリケーションまたは拡張機能を使用する必要がよくありました。しかし今では、写真アプリに OCR 機能が直接組み込まれているため、画像からテキストを抽出するのがこれまでより簡単になりました。
OCR は、Optical Character Recognition (光学式文字認識) の略で、コンピューターが画像からテキストを認識し、編集可能なデジタル形式に変換するのに役立つテクノロジーです。この機能により、ユーザーは写真、スキャンした文書、さらには手書きからテキストをコピーし、Word、Excel、電子メールなどの他のアプリケーションにすばやく貼り付けることができます。
Windows のフォト アプリの OCR 機能は、人工知能アルゴリズムを使用して画像内の文字を識別および分析します。ユーザーは、写真アプリで画像を開き、OCR アイコンをクリックして、テキストを抽出するか、コピーする特定の領域を選択するだけです。
OCR を写真アプリケーションに統合すると、Windows ユーザーに多くのメリットがもたらされます。業務の生産性向上だけでなく、視覚障害のあるユーザーへのサポートも可能です。さらに、この機能は 160 以上の言語もサポートしているため、世界中のユーザーが効果的に使用できるようになります。
OCR 機能に加えて、Microsoft は、Snapdragon を搭載した Copilot+ コンピュータに「超解像度」機能を追加し、写真編集機能のバグを修正し、アプリ内のナビゲーションを改善することにより、写真アプリも改善しました。
Windows ユーザーと iOS ユーザー向けに、どちらも画像からテキストを抽出する強力なツールを備えています。ただし、Windows の OCR は 160 以上の言語をサポートしますが、iOS の Live Text は特定の言語のみをサポートします。
OCR 機能を写真アプリに統合することは、Microsoft にとって Windows でのユーザー エクスペリエンスを向上させるための重要なステップです。この機能は、仕事の生産性の向上から視覚障害のあるユーザーのサポートまで、ユーザーに多くのメリットをもたらすことが期待されます。これにより、Microsoft は写真アプリケーションをより強力で便利な写真編集および管理ツールに変えようとしています。
Microsoft は、Windows 11 と Windows 10 の両方のフォト アプリに光学式文字認識 (OCR) を正式に導入し、ユーザー エクスペリエンスと情報アクセシビリティの向上に大きな前進をもたらしました。
これまで、多くの Windows ユーザーは、この機能を実行するためにサードパーティのアプリケーションや拡張機能に依存する必要があったに違いありません。 OCR が組み込まれているため、ユーザーは使い慣れた写真アプリで画像からテキストを簡単に抽出できるようになりました。 Phong Vu Tech News に参加して、OCR の改善の使用方法を調べてみましょう。
OCRとは何ですか?
OCR は、Optical Character Recognition (光学式文字認識) の略です。これは、コンピューターが画像内のテキストを「見て」「理解」し、ピクセルから編集可能なデジタル テキストに変換できるようにするテクノロジーです。言い換えれば、OCR を使用すると、写真、スキャンした紙文書、さらには手書きからテキストをコピーし、Word、Excel、電子メールなどの他のアプリケーションにすばやく貼り付けることができます。

Windows のフォト アプリケーションの OCR 機能
OCRの動作メカニズム
Windows のフォト アプリの OCR 機能は、高度な人工知能 (AI) アルゴリズムを使用して、画像内の文字を識別および分析します。アプリケーションは自動的に画像全体をスキャンし、テキストを含む領域を特定し、そのテキスト コンテンツを抽出します。
写真アプリでの使い方
写真アプリの OCR 機能の使用は非常に簡単です。テキストを含む画像を開くと、アプリケーションは自動的に認識し、画像の下に OCR アイコンを表示します。ユーザーはこのアイコンをクリックするだけでテキスト全体を抽出したり、テキストの特定の領域を選択してクリップボードにコピーしたりできます。

Windows での OCR の利点
OCR を写真アプリケーションに統合すると、Windows ユーザーに多くの実用的なメリットがもたらされます。
- 生産性の向上: OCR は、画像からデータを手動で入力する場合に比べて、時間と労力を節約します。
- アクセシビリティの向上: 視覚障害のあるユーザー、または読むことが困難なユーザーは、OCR をスクリーン リーダーと組み合わせて使用し、画像からテキスト コンテンツを聞くことができます。
- 多言語サポート: Windows の OCR 機能は 160 以上の言語をサポートしており、世界中のユーザーが効果的に使用できるように支援しています。
- ワークフローの最適化: OCR を使用すると、画像からの情報の編集、保存、共有が簡単になります。たとえば、スクリーンショット、スキャンした文書、表などからテキストを簡単に抽出し、電子メール、レポート、プレゼンテーションなどに貼り付けることができます。
写真アプリのその他のいくつかの改善
OCR 以外にも、Microsoft はより良いユーザー エクスペリエンスを提供するために、写真アプリに他の多くの注目すべき改良点も導入しました。
Copilot+ の「超解像度」
Snapdragon チップを実行する Copilot+ コンピュータに対して、Microsoft は、AI テクノロジーのおかげで詳細な品質を維持しながら、画像を元のサイズの最大 8 倍まで拡大できる「超解像度」機能を追加します。この機能は、大きな画像を印刷したり、画像を拡大して詳細を確認したり、解像度を下げずに画像をトリミングしたりする必要がある場合に非常に便利です。
写真編集機能のバグ修正
Microsoft はまた、Copilot+ コンピュータでの写真作成および写真編集機能に関連する多数のエラーも修正し、全体的な画質の向上に貢献しました。
ナビゲーションの改善
更新された写真アプリは、写真を開くためのシングルクリック モードをサポートしており、ライブラリ内の写真の閲覧がより速く、より効率的になります。
iOS での OCR と Live Text の比較
Windows の OCR と iOS の Live Text はどちらも、ユーザーが画像からテキストを抽出するのに役立つ強力なツールです。ただし、いくつかの違いもあります。
iOS 上の Live Text は、正確な認識能力と高速な処理速度で高く評価されています。また、オペレーティング システムに深く統合されているため、ユーザーはカメラ アプリやスクリーンショットで直接使用できます。ただし、Live Text は現在、特定の言語のみをサポートしています。
Windows 上の OCR は後からリリースされましたが、多言語サポート (160 言語以上) という利点があります。写真アプリケーションへの統合により、ユーザーは簡単にアクセスして使用できるようになります。ただし、Windows での OCR のパフォーマンスと精度については、実際の使用時にさらに検証する必要があります。
まとめ
OCR を写真アプリケーションに統合することは、Windows でのユーザー エクスペリエンスを向上させ、アクセシビリティを強化する上で Microsoft にとって重要な前進です。この機能は、仕事の生産性の向上から視覚障害のあるユーザーのサポートまで、ユーザーに多くのメリットをもたらすことが期待されます。 Microsoft は、その他の改良とともに、フォト アプリをより強力で便利な写真編集および管理ツールに変えることに取り組んでいます。


